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Prefácio 


Por seis edições até agora, Métodos matemáticos para físicos forneceu todos os métodos matemáticos que os 
pretendentes às carreiras de cientistas e engenheiros provavelmente encontrarão como estudantes e pesquisadores. 
Há material mais do que suficiente para um curso de graduação ou pós-graduação de dois semestres. 


O livro é avançado no sentido de que as relações matemáticas quase sempre são provadas, além de ilustradas 
em termos de exemplos. Essas provas não são o que um matemático consideraria como rigorosas, mas dão um 
esboço das idéias e enfatizam as relações que são essenciais para o estudo da física e campos relacionados. Essa 
abordagem incorpora teoremas que normalmente não são citados nas abordagens mais gerais, mas se adaptam 
perfeitamente bem às aplicações mais restritas exigidas pela física. Por exemplo, um físico normalmente aplica o 
teorema de Stokes a uma superfície partindo do entendimento tácito de que ela é simplesmente conectada. Neste 
livro, essas suposições ficam mais explícitas. 


Habilidades para Resolver Problemas 


O livro também adota um foco deliberado sobre habilidades para resolver problemas. Esse nível mais avançado 
de entendimento e aprendizado ativo é rotineiro em cursos de física e requer prática da parte do leitor. Seguindo 
esse princípio, os conjuntos extensivos de problemas apresentados em cada capítulo fazem parte integral do livro. 
Foram revisados e atualizados com cuidado e seu número aumentou nesta Sexta Edição. 


Como o Livro deve ser Usado 


Estudantes de graduação terão melhor aproveitamento se começarem revendo o Capítulo 1 de acordo com o nível 
de treinamento da classe. A Seção 1.2 sobre as propriedades de transformação de vetores, o produto cruzado e 
a invariância do produto escalar sob rotações pode ser adiada até o início da análise tensorial, para a qual essas 
seções funcionam como uma introdução e servem como exemplos. Podem continuar seus estudos com álgebra 
linear no Capítulo 3 e então, talvez passar para tensores e simetrias (Capítulos 2 e 4) e, em seguida, análise real e 
complexa (Capítulos 5 a 7), equações diferenciais (Capítulos 9 e 10) e funções especiais (Capítulos 11 a 13). 


Em geral, o núcleo de um curso de graduação de um semestre compreende os Capítulos 5 a 10 e 11 a 13, que 
tratam de análise real e complexa, equações diferenciais e funções especiais. Dependendo do nível dos estudantes 
em um curso, pode-se estudar um pouco de álgebra linear no Capítulo 3 (eigenvalores, por exemplo,), juntamente 
com simetrias (teoria de grupo no Capítulo 4). Tensores (Capítulo 2) podem ser estudados se necessário ou se 
desejado. A teoria de grupo também pode ser incluída com equações diferenciais (Capítulos 9 e 10). Relações 
adequadas foram incluídas e discutidas nos Capítulos 4 e 9. 


Um curso de dois semestres pode abordar tensores, teoria de grupo e funções especiais (Capítulos 11 a 13) 
mais extensivamente e adicionar séries de Fourier (Capítulo 14), transformadas integrais (Capítulo 15), equações 
integrais (Capítulo 16) e cálculo de variações (Capítulo 17). 
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Mudanças na Sexta Edição 


Nesta Sexta Edição foram feitas mudanças em quase todos os capítulos, acrescentando exemplos e problemas e 
mais derivações de resultados. Vários erros de ortografia causados pela digitalização para o sistema LaTeX, um 
processo sujeito a erros à taxa de muitos erros por páginas foram corrigidos, juntamente com erros tais como o das 
matrizes de Dirac no Capítulo 3. Alguns capítulos mudaram de lugar. A função gama agora está no Capítulo 8, 
logo após os Capítulos 6 e 7 sobre funções complexas de uma variável, já que é uma aplicação desses métodos. 
Equações diferencias agora estão nos Capítulos 9 e 10. Foi acrescentado um novo Capítulo sobre probabilidade, 
bem como novas subseções sobre formas diferenciais e equações de Mathieu atendendo a insistentes pedidos 
de leitores e estudantes ao longo dos anos. As novas subseções são mais avançadas e escritas no estilo conciso 
do livro, elevando-as assim ao nível de pós-graduação. Foram acrescentados muitos exemplos, por exemplo nos 
Capítulos 1 e 2, que costumam ser usados na física ou são figurinhas carimbadas em cursos de física. Foram feitas 
várias adições no Capítulo 3, tais como dependência linear de vetores, espaços vetoriais duais e decomposição 
espectral de matrizes simétricas ou Hermitianas. Uma subseção sobre a equação de difusão dá destaque especial 
a métodos para adaptar soluções de equações diferenciais parciais a condições de fronteira. Foram desenvolvidas 
novas fórmulas para polinomiais de Hermite, incluídas no Capítulo 13 e úteis para tratar vibrações moleculares; 
elas são de interesse do físico-químico. 
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Análise Vetorial 


1.1 Definições, Abordagem Elementar 


Na ciência e na engenharia, fregiientemente encontramos quantidades que têm grandeza e apenas grandeza: massa, 
tempo e temperatura. Denominamos essas grandezas quantidades escalares e elas continuam as mesmas, não 
importando as coordenadas que usarmos. Ao contrário, muitas quantidades físicas interessantes têm grandeza 
e, além disso, uma direção associada. Esse segundo grupo inclui deslocamento, velocidade, aceleração, força, 
momento linear e momento angular. Quantidades que têm grandeza e direção são denominadas quantidades 
vetoriais. Em geral, em tratamentos elementares, um vetor é definido como uma quantidade que tem grandeza 
e direção. Para distinguir vetores de escalares, identificamos quantidades vetoriais com letras em negrito, isto é, V. 

Nosso vetor pode ser convenientemente representado por uma seta de comprimento proporcional à grandeza. A 
direção da seta dá a direção do vetor, e o sentido positivo de direção é indicado pela ponta. Por essa representação, 
a adição vetorial 


C=A+B (1.1) 


consiste em colocar a extremidade traseira do vetor B na ponta do vetor A. Então o vetor C é representado por 
uma seta desenhada a partir da extremidade traseira de A até a ponta de B. Esse procedimento, a lei de adição 
do triângulo, atribui significado à Equação (1.1) e é ilustrado na Figura 1.1. Completando o paralelogramo, vemos 
que 


Figura 1.1: Lei do triângulo da adição vetorial. 


C=A+B=B+A, (1.2) 


como mostra a Figura 1.2. Em palavras, a adição de vetores é comutativa. 
Para a soma de três vetores, (Figura 1.3), 


D=A+B+4C, 


podemos primeiro somar A e B: 


A+B=-=E. 
Então, essa soma é adicionada a C: 


D-E+4C. 
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B 


Figura 1.2: Lei do paralelogramo da adição vetorial. 


B 


D 


Figura 1.3: A adição de vetores é associativa. 


De modo semelhante, podemos primeiro somar Be C: 
B+C=-F. 


Então, 
D-=-A+F. 


Em termos da expressão original, 
(A+B)+C=A+(B+4C). 


A adição de vetores é associativa. 

Um exemplo físico direto da lei de adição do paralelogramo é dado por um peso suspenso por dois fios. Se o 
ponto de junção (O na Figura 1.4) estiver em equilíbrio, a soma vetorial das duas forças F; e F2 deve exatamente 
anular a força da gravidade dirigida para baixo, F3. Nesse caso, a lei de adição do paralelogramo está sujeita à 
verificação experimental imediata.! 

A subtração pode ser executada definindo o negativo de um vetor como um vetor da mesma grandeza, mas com 
sentido inverso. Então, 

A-B=A+(-B). 


Na Figura 1.3, 
A-E-B. 


Note que os vetores são tratados como objetos geométricos que são independentes de qualquer sistema de 
coordenadas. Esse conceito de independência de um sistema de coordenadas preferencial é desenvolvido com 
detalhes na seção seguinte. 

A representação do vetor A por uma seta sugere uma segunda possibilidade. A seta A (Figura 1.5), iniciando 
na origem,? termina no ponto (Az, Ay, Az). Assim, se concordarmos que o vetor deve começar na origem, a 
extremidade positiva pode ser especificada dando as coordenadas cartesianas (Az, Ay, A.) da ponta da seta. 

Embora A possa representar qualquer quantidade vetorial (momento linear, campo elétrico etc.), uma 
quantidade vetorial particularmente importante, o deslocamento da origem até o ponto (x,y, z) é denotado pelo 


"Em termos estritos, a adição pela regra do paralelogramo foi introduzida como uma definição. Experimentos mostram que, se admitirmos 
que as forças são quantidades vetoriais e as combinarmos pela adição do paralelogramo, a condição de equilíbrio de força resultante zero é 
satisfeita. 

2Poderíamos iniciar em qualquer ponto de nosso sistema cartesiano de referência; escolhemos a origem por simplicidade. Essa liberdade de 
deslocar a origem do sistema de coordenadas sem afetar a geometria é denominada invariância de translação. 
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Figura 1.4: Equilíbrio de forças: Fı + F2 = —Fs. 


Figura 1.5: Componentes cartesianas e co-senos diretores de A. 
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símbolo especial r. Então, podemos escolher entre nos referirmos ao deslocamento como o vetor r ou como a 
coleção (x, y, z), as coordenadas de sua extremidade: 


ro (x,y,z). (1.3) 


Usando r para a grandeza do vetor r, constatamos que a Figura 1.5 mostra que as coordenadas da extremidade e a 
grandeza são relacionadas por 


£ = r Cos Q, y = r cos p, zZ =r cosy. (1.4) 


Aqui, cos a, cos 3 e cos y são denominados co-senos diretores, sendo a o ângulo entre o vetor dado e o eixo x 
positivo e assim por diante. Um pouco mais de vocabulário: as quantidades A,, A, e A, são conhecidas como as 
componentes (cartesianas) de A ou as projeções de A, com cos? a + cos? 8 + cos? y = 1. 

Assim, qualquer vetor A pode ser resolvido em suas componentes (ou projetado sobre os eixos coordenados) 
para resultar A, = Acosa etc., como na Equação (1.4). Podemos escolher entre nos referirmos ao vetor como 
uma quantidade única A ou às suas componentes (Ax, Ay, Az). Note que o índice x em A, denota a componente 
x e não uma dependência da variável x. A decisão de utilizar A ou suas componentes (Az, Ay, Az) é, em essência, 
uma escolha entre uma representação geométrica ou uma representação algébrica. Use qualquer das representações 
segundo sua conveniência. A representação “geométrica da seta no espaço” pode ajudar na visualização. O 
conjunto algébrico de componentes em geral é mais adequado para cálculos precisos numéricos ou algébricos. 

Vetores entram na física em duas formas distintas: (1) um vetor A pode representar uma única força agindo 
sobre um único ponto. A força da gravidade agindo no centro de gravidade ilustra essa forma; (2) um vetor 
A pode ser definido sobre uma região estendida, isto é, A e suas componentes podem ser funções da posição 
Ar = As(x,y,2) e assim por diante. Exemplos desse tipo são a velocidade de um fluido variando de ponto a 
ponto em um dado volume e campos elétricos e magnéticos. Esses dois casos podem ser distinguidos referindo-se 
ao vetor definido sobre uma região como um campo vetorial. O conceito do vetor definido sobre uma região e 
sendo uma função de posição se tornará de extrema importância na diferenciação e integração de vetores. 

Neste estágio é conveniente introduzir vetores unitários ao longo de cada um dos eixos coordenados. Seja * um 
vetor de grandeza unitária apontando na direção positiva x, Y, um vetor de grandeza unitária na direção positiva 
y, e Z um vetor de grandeza unitária na direção positiva z. Então, RAs é um vetor de grandeza igual a |A,| e na 
direção x. Por adição de vetores, 

A = Ar + ĵAy + 2A. (1.5) 


Note que, se A se anular, todas as suas componentes devem se anular individualmente, isto é, se 
A=0, então 4, = Ay = A; = 0. 


Isso significa que esses vetores unitários servem como uma base ou um conjunto completo de vetores no espaço 
euclidiano tridimensional, em termos do qual qualquer vetor pode ser expandido. Assim, a Equação (1.5) é uma 
afirmação de que os três vetores unitários $, Y e Z varrem nosso espaço tridimensional real: qualquer vetor pode 
ser escrito como uma combinação linear de $, ŷ e 2. Visto que $, Y e Z são linearmente independentes (nenhum é 
uma combinação linear dos outros dois), eles formam uma base para o espaço euclidiano tridimensional real. Por 
fim, pelo teorema de Pitágoras, o módulo do vetor A é 


Al = (42 + 424 42) (1.6) 


Note que os vetores unitários associados às coordenadas não são o único conjunto completo ou base. Essa resolução 
de um vetor em suas componentes pode ser realizada em uma variedade de sistemas coordenados, como será 
mostrado no Capítulo 2. Aqui, vamos nos restringir às coordenadas cartesianas, em que os vetores unitários têm 
as coordenadas * = (1,0,0), = (0,1,0) e 2 = (0,0,1), e todos têm comprimento e direção constantes, 
propriedades características das coordenadas cartesianas. 

Em substituição à técnica gráfica, a adição e a subtração de vetores agora podem ser realizadas em termos de 
suas componentes. Para A = X4, + ÑA, + 2A, e B -%B,+YB,+2B,, 


A+B = (Az E Bz) + (4; SE By) +2(4; ma B.). (1.7) 


g ; : itários $, 9 e 2 sā iência. Ra iis: 
Deve-se enfatizar aqui que os vetores unitários e Z são usados por conveniência. Eles não são essenciais 
podemos descrever vetores e usá-los exclusivamente em termos de suas componentes: A — (Az, Ay, Az). Essa 


ELSEVIER 
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é a abordagem das duas mais poderosas e mais sofisticadas definições de vetor que serão discutidas na próxima 
seção. Contudo, $, Y e Z enfatizam a direção. 

Até aqui definimos as operações de adição e subtração de vetores. Nas próximas seções serão definidas três 
variedades de multiplicação com base em sua aplicabilidade: um produto escalar, ou interno, um produto vetorial 
peculiar ao espaço tridimensional e um produto direto, ou externo, que resulta em um tensor de segunda ordem. A 
divisão por um vetor não é definida. 


Exercícios 


1.1.1 
1.1.2 


1.1.3 


1.1.4 


1.1.5 


1.1.6 


1.1.7 


1.1.8 


1.1.9 


1.1.10 


1.1.11 


Mostre como encontrar A e B, dados A + B e A — B. 

O vetor A, cuja grandeza é 1,732 unidade e faz ângulos iguais com os eixos coordenados. Ache 
AA ,e Az. 

Calcule as componentes de um vetor unitário que se encontra no plano xy e faz ângulos iguais com 
as direções positivas dos eixos x e y. 


A velocidade do veleiro A em relação ao veleiro B, vre, é definida pela equação Vi = VA — VB, 
onde v4 é a velocidade de A e vp é a velocidade de B. Determine a velocidade de A em relação a 


B se 
va = 30 km/h no sentido leste 


vp = 40 km/h no sentido norte. 


Resposta: Vre, = 50 km/h, 53, 1º no sentido sudeste. 


Um veleiro navega durante 1 h a 4 km/h (em relação à água) no rumo constante de bússola de 40º 
nordeste. O veleiro é levado simultaneamente por uma corrente. Ao final de uma hora o barco está 
a 6,12 km de seu ponto de partida. A reta entre seu ponto de partida e sua localização está a 60º 
nordeste. Ache as componentes x (rumo leste) e y (rumo norte) da velocidade da água. 

Resposta: Vieste = 2, 73 km/h, Vnorte = 0 km/h. 
Uma equação vetorial pode ser reduzida à forma A = B. A partir disso, mostre que a equação 
vetorial única é equivalente a três equações escalares. Admitindo a validade da segunda lei de 
Newton, F = ma, como uma equação vetorial, isso significa que ay depende somente de Fy e é 
independente de F} e F,. 
Os vértices A, B e C de um triângulo são dados pelos pontos (—1,0,2), (0,1,0) e (1,-—1,0), 
respectivamente. Ache o ponto D, tal que a figura ABC D forme um paralelogramo plano. 

Resposta: (0, —2,2) ou (2,0, —2). 

Um triângulo é definido pelos vértices de três vetores A, B e C, que se estendem da origem. Em 
termos de A, Be C, mostre que a soma vetorial dos lados sucessivos do triângulo (AB+BC+CA) 
é zero, sendo que o lado AB vai de A a B etc. 


Uma esfera de raio a tem centro em um ponto r1. 


(a) Escreva a equação algébrica para a esfera. 
(b) Escreva uma equação vetorial para a esfera. 
Resposta: (a) (£ — £1)? + (y — y1)? + (z = 21)? =a2. 

(b) r = rı + a, com rı = centro. 

(a assume todas as direções mas tem uma grandeza fixa a.) 
Um refletor de canto é formado por três superfícies refletoras mutuamente perpendiculares. Mostre 
que um raio de luz que incide sobre esse refletor (atingindo todas as três superfícies) é refletido de 
volta ao longo de uma linha paralela à linha de incidência. 
Sugestão: Considere o efeito de uma reflexão sobre as componentes de um vetor que descreve a 
direção do raio de luz. 


Lei de Hubble. Hubble descobriu que galáxias distantes estão se afastando com uma velocidade 
proporcional à sua distância do local onde estamos na Terra. Para a i-ésima galáxia, 


v; = Hori, 


tendo nós na origem. Mostre que esse afastamento das galáxias em relação a nós não implica que 
estamos no centro do universo. Especificamente, considere a galáxia em rı uma nova origem e 
mostre que ainda assim a lei de Hubble é obedecida. 
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1.1.12 Ache os vetores diagonais de um cubo unitário com um vértice na origem e seus três lados ao longo 
dos eixos cartesianos. Mostre que há quatro diagonais de comprimento v3. Representando essas 
diagonais como vetores, quais são suas componentes? Mostre que o comprimento das diagonais das 
faces do cubo é 2 e determine suas componentes. 


1.2 Rotação dos Eixos Coordenados” 


Na seção anterior, vetores foram definidos ou representados de dois modos equivalentes: (1) geometricamente, 
especificando grandeza e direção, como uma seta, e (2) algebricamente, especificando as componentes relativas 
aos eixos cartesianos. A segunda definição é adequada para a análise vetorial deste capítulo. Nesta seção, 
são apresentadas duas definições mais refinadas sofisticadas e poderosas. A primeira é que o campo vetorial 
é determinado em termos do comportamento de suas componentes sob rotação dos eixos coordenados. Essa 
abordagem de teoria de transformação leva à análise tensorial do Capítulo 2 e a grupos de transformação no 
Capítulo 4. A segunda é a definição de componente da Seção 1.1 refinada e generalizada segundo os conceitos dos 
matemáticos de vetor e espaço vetorial. Essa abordagem leva a espaços de função, incluindo o espaço de Hilbert. 

A definição de vetor como uma quantidade que tem grandeza e direção é incompleta. Por um lado, encontramos 
quantidades, tais como constantes elásticas e índices de refração em cristais anisotrópicos, que têm grandeza 
e direção, mas não são vetores. Por outro lado, nossa abordagem ingênua é inaquedequada para generalizar e 
estender para quantidades mais complexas. Procuramos uma nova definição de campo vetorial usando nosso vetor 
coordenada r como um protótipo. 

Há uma base física para nosso desenvolvimento de uma nova definição. Descrevemos nosso mundo físico pela 
Matemática, mas essa descrição e quaisquer previsões físicas que possamos fazer devem ser independentes de 
nossas convenções matemáticas. 

Em nosso caso específico, admitimos que o espaço é isotrópico; isto é, não há uma direção preferencial ou todas 
as direções são equivalentes. Então, o sistema físico que está sendo analisado ou a lei da física que está sendo 
enunciada não pode e não deve depender de nossa escolha ou orientação dos eixos coordenados. Especificamente, 
se uma quantidade S não depender da orientação dos eixos coordenados, ela é denominada escalar. 

Agora retornamos ao conceito do vetor r como um objeto geométrico independente do sistema de coordenadas. 
Vamos examinar r em dois sistemas diferentes, um rotacionado em relação ao outro. 

Por simplicidade, em primeiro lugar consideramos o caso bidimensional. Se as coordenadas x e y forem 
rotacionadas no sentido anti-horário por um ângulo y, mantendo r fixo (Figura 1.6), obtemos as seguintes relações 
entre as componentes projetadas no sistema original (sem linha) e projetadas no novo sistema rotacionado (com 
linha): 


q = £ COS Y +ysen p, 


1 


y = —asen Y + y cos q. (158) 


Vimos na Seção 1.1 que um vetor pode ser representado pelas coordenadas de um ponto; isto é, as coordenadas 
eram proporcionais às componentes do vetor. Por conseguinte, as componentes de um vetor devem se transformar, 
sob rotação, em coordenadas de um ponto (tal como r). Portanto, sempre que qualquer par de quantidades A, e 
Ay no sistema de coordenadas xy é transformado em (A/,, A, ) por essa rotação do sistema de coordenadas com 


As = Áz cos Y + Aysen y, (1.9) 
A, = —Agsen p + Ay cos p, 

definimos! 4, e A, como as componentes de um vetor A. Nosso vetor agora é definido em termos da 
transformação de suas componentes sob rotação do sistema de coordenadas. Se A, e Ay se transformam do mesmo 
modo que x e y, as componentes do vetor geral bidimensional da coordenada r, elas são as componentes de um 
vetor A. Se A, e A, não mostrarem essa invariância de forma (também denominada covariância) quando as 
coordenadas forem rotacionadas, elas não formam um vetor. 

As componentes do campo vetorial A, e Ay que satisfazem as equações definidoras, Equações (1.9), associam 
uma grandeza A e uma direção com cada ponto no espaço. A grandeza é uma quantidade escalar, invariante 
em relação à rotação do sistema de coordenadas. A direção (relativa ao sistema “sem linha”) é, da mesma 
maneira, invariante pela rotação do sistema coordenado (veja o Exercício 1.2.1). O resultado de tudo isso é 
que as componentes de um vetor podem variar de acordo com a rotação do sistema coordenado “com linha”. 


3Esta seção é opcional aqui. Será essencial para o Capítulo 2. 
4Uma quantidade escalar não depende da orientação de coordenadas; S’ = S expressa o fato de que ela é invariante sob rotação das 
coordenadas. 
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Figura 1.6: Rotação de eixos coordenados cartesianos ao redor do eixo z. 


É isso que dizem as Equações (1.9). Mas a variação com o ângulo é tal que as componentes no sistema 
coordenado rotacionado A’, e A; definem um vetor com a mesma grandeza e a mesma direção do vetor definido 
pelas componentes 4, e A, em relação aos eixos coordenados x e y (compare com o Exercício 1.2.1). As 
componentes de A em um determinado sistema de coordenadas constituem a representação de A naquele 
sistema de coordenadas. As Equações (1.9), as relações de transformação, são uma garantia de que a entidade 
A é independente da rotação do sistema de coordenada. 

Para passar para três e, mais adiante, quatro dimensões, achamos conveniente usar uma notação mais compacta. 
Seja 


ba (1.10) 
yY > ta 
Q11 = COS, a12 = sen py, a 11) 
Q21 = —SN Y, a22 = COS Q. i 


Então as Equações (1.8) tornam-se 


£i = QT + A1222, 
1 1171 1272 (1.12) 


Lo = Q21%1 T Ago. 


O coeficiente a;; pode ser interpretado como um co-seno diretor, o co-seno do ângulo entre qi er j; isto é, 


a12 = cos(x}, £2) = sen q, 


azı = cos(z3, £1) = cos(p + 5) = —sen g. (1.13) 


A vantagem da nova notação? é que ela nos permite usar o símbolo de somatório e reescrever as Equações (1.12) 
como 


2 
j=1 


5Você talvez estranhe a substituição de uma parâmetro «p por quatro parâmetros a; je É claro que a; j não constitui um conjunto mínimo de 
parâmetros. Para duas dimensões os quatro a;; estão sujeitos às três limitações dadas na Equações (1.18). A justificativa para esse conjunto 
redundante de co-senos diretores é a conveniência que ele oferece. Esperamos que essa conveniência se torne mais evidente nos Capítulos 2 
e 3. Para rotações tridimensionais (9 a;;, mas somente três independentes) são fornecidas descrições alternativas por: (1) ângulos de Euler 
discutidos na Seção 3.3, (2) quatérnions, e (3) parâmetros de Cayley-Klein. Essas alternativas têm suas respectivas vantagens e desvantagens. 
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Note que i continua como um parâmetro que dá origem a uma única equação quando for igualado a 1 e a uma 
segunda equação quando for igualado a 2. O índice j, é claro, é um índice de somatório, um índice fictício e, como 
acontece com uma variável de integração, j pode ser substituído por qualquer outro símbolo conveniente. 

Agora, a generalização para três, quatro ou N dimensões é simples. Diz-se que o conjunto de N quantidades V; 
forma as componentes de um vetor N-dimensional V se e somente se seus valores relativos aos eixos coordenados 
rotacionados forem dados por 


V! =X aV}, i=1,2,..., N. (1.15) 


Como antes, a;; é o co-seno do ângulo entre x; e xj. Muitas vezes o limite superior de N e a faixa correspondente 
de i não serão indicados. É dado como certo que você sabe quantas dimensões seu espaço tem. 

Pela definição de a;; como o co-seno do ângulo entre a direção x, positiva e a direção x; positiva, podemos 
escrever (coordenadas cartesianas)º 


Og, 
Usando a rotação inversa (p — —) temos 
j du; 
Tj = y QijTi ou dz! = Qij. (1.16b) 


Note que essas são derivadas parciais. Usando as Equações (1.16a) e (1.16b), a Equação (1.15) torna-se 


V! = Siy = Dam (1.17) 


p o 


Os co-senos diretores a;; satisfazem uma condição de ortogonalidade 
Do tijaik = Ogh, (1.18) 
i 


ou, equivalentemente, 


X ajiam = ĝjr- (1.19) 


Aqui, o símbolo jx é o delta de Kronecker definido por 


œ 


jp=1 para j= k, 


, 1.20 
j=0 para j#k. o 


œ 


É fácil verificar que as Equações (1.18) e a Equação (1.19) são válidas no caso bidimensional, substituindo os 
aij específicos das Equações (1.11). O resultado é a bem conhecida identidade sen?y + cos? y = 1 para o caso 
de não-nulo. Para verificar a Equação (1.18) na forma geral, podemos usar as formas das derivadas parciais das 
Equações (1.16a) e (1.16b) para obter 

Ox; Otk dx; Ox; oxi 


da, Ox, dada Om) Sire) 


A última etapa é obtida usando-se as regras padrões para a diferenciação parcial, admitindo que x; é uma função de 
£1, 25, 14 e assim por diante. O resultado final, dx ;/dx;, é igual a jp, já que se admite que x; e £k, como eixos 
coordenados, são perpendiculares (duas ou três dimensões) ou ortogonais (para qualquer número de dimensões). 
De modo equivalente, podemos admitir que x; e xy (j  k) são variáveis totalmente independentes. Se j = k, a 
derivada parcial é claramente igual a 1. 

Ao redefinir um vetor em termos do modo como suas componentes se transformam sob uma rotação do sistema 
de coordenadas, devemos enfatizar dois pontos: 


*Diferencie x! em relação a xj. Veja a discussão após a Equação (1.21). 
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1. Essa definição é desenvolvida porque é útil e apropriada para descrever nosso mundo físico. Nossas equações 
vetoriais serão independentes de qualquer sistema de coordenadas particular. (O sistema de coordenadas não 
precisa nem ao menos ser cartesiano.) A equação vetorial sempre pode ser expressa em algum sistema de 
coordenadas particular e, para obter resultados numéricos, devemos, em última instância, expressar a equação 
em algum sistema de coordenadas específico. 

2. Essa definição está sujeita a uma generalização que abrirá o ramo da matemática conhecido como análise 
tensorial (Capítulo 2). 


Aqui, devemos fazer uma qualificação. O comportamento das componentes do vetor sob rotação das 
coordenadas é usado na Seção 1.3 para provar que um produto escalar é um escalar; na Seção 1.4, para provar 
que um produto vetorial é um vetor; e na Seção 1.6, para mostrar que o gradiente de um escalar 1), Vy), é um vetor. 
O restante deste capítulo prossegue tendo como base as definições menos restritivas de vetor dadas na Seção 1.1. 


Resumo: Vetores e Espaço Vetorial 

Em matemática costuma-se denominar uma tripla ordenada de números reais (71, £2, £3) vetor x. O número x, 
é denominado a n-ésima componente do vetor x. A coleção de todos esses vetores (obedecendo às propriedades 
apresentadas a seguir) forma um espaço vetorial tridimensional real. Atribuímos cinco propriedades a nossos 
vetores: sex = (x1, £2, £3) ey = (Y1, Y2, Y3), 

. Igualdade de vetores: x = y significa x; = y;, i = 1,2,3. 

. Adição de vetores: x + y = z significa z; + y; = zį;, i = 1,2,3. 

. Multiplicação escalar: ax +> (azı, az2, azz) (com a real). 

. Negativo de um vetor: —x = (—1)x & (—z£1, —£2, —1£3). 

. Vetor nulo: Existe um vetor nulo O & (0, 0,0). 


ELOI 


Uma vez que as componentes de nosso vetor são números reais (ou complexos), as seguintes propriedades 
também valem: 


1. A adição de vetores é comutativa: x + y = y + X. 
2. A adição de vetores é associativa: (x + y) +z = x + (y + 2). 
3. A multiplicação escalar é distributiva: 


a(x + y) = ax + ay e também (a + b)x = ax + bx. 


4. A multiplicação escalar é associativa: (ab)x = a(bx). 


Além disso, o vetor nulo O é único, assim como o negativo de um dado vetor x. 

No que tange aos vetores em si, essa abordagem é uma mera formalização da discussão da componente da 
Seção 1.1. A importância está nas extensões, que serão consideradas em capítulos posteriores. No Capítulo 4, 
mostramos que vetores formam um grupo abeliano sob adição e um espaço linear com as transformações no 
espaço linear descritas por matrizes. Por fim, e talvez mais importante, para a Física avançada, o conceito de 
vetores apresentado aqui pode ser generalizado para: (1) quantidades complexas,” (2) funções e (3) um número 
infinito de componentes. Isso leva a espaços de funções de infinitas dimensões, os espaços de Hilbert, que são 
importantes na moderna teoria quântica. Uma breve introdução às expansões de funções e ao espaço de Hilbert 
aparece na Seção 10.4. 


Exercícios 


1.2.1 (a) Mostre que a grandeza de um vetor A, A = (A2 + 42)!/2, é independente da orientação do 
sistema de coordenadas rotacionado. 


2 2)1/2 12 129 1/2 
(Az + 43) = (A; +45) , 
isto é, é independente do ângulo de rotação y. 
Essa independência do ângulo é expressa dizendo que A é invariante sob rotações. 
(b) Em um ponto (x,y) dado, A define um ângulo a relativo ao eixo x positivo e um ângulo a’ 
relativo ao eixo gx’ positivo. O ângulo entre x e x’ é p. Mostre que A = A’ define a mesma 


7O espaço vetorial de n dimensões de n reais costuma ser denominado R”, e o espaço vetorial de n dimensões de n complexas é 
denominado C”. 
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direção no espaço quando expresso em termos de suas componentes “linha”, bem como quando 
expresso em termos de suas componentes “sem linha”; isto é, 


ad =a-ç. 


1.2.2 Prove a condição de ortogonalidade 5; ajiki = Ôjk. Como um caso especial disso, os co-senos 
diretores da Seção 1.1 satisfazem a relação 


cos? a + cos? 8 + cos? y = 1, 


um resultado que segue da Equação (1.6). 


1.3 Produto Escalar ou Produto Interno 


Agora que já definimos vetores, passaremos a combiná-los. As leis para combinação de vetores devem 
ser matematicamente consistentes. Dentre as possibilidades que são consistentes, selecionamos duas que são 
interessantes tanto em termos matemáticos quanto em termos físicos. Uma terceira possibilidade é apresentada 
no Capítulo 2, no qual formamos tensores. 

A projeção de um vetor A sobre um eixo coordenado, que dá suas componentes cartesianas na Equação (1.4), 
define um caso geométrico especial do produto escalar entre A e os vetores unitários coordenados: 


Ar = Acosa=A-, A =Acosß=A-:ŷ, A,=Acosy=A-2Z. (1.22) 


Esse caso especial de um produto escalar em conjunção com propriedades gerais do produto escalar é suficiente 
para compreender o caso geral do produto escalar. 

Exatamente como a projeção é linear em A, queremos que o produto escalar de dois vetores seja linear em A e 
B, isto é, obedeça às leis distributiva e associativa 


A(B+C)=A-B+4+A-C (1.234) 
A-(yB)-(yA)-B-yA-B, (1.23b) 


em que y é um número. Agora podemos usar a decomposição de B em suas componentes cartesianas conforme a 
Equação (1.5), B = B,& + B, + B,2, para construir o escalar geral ou o produto escalar dos vetores A e B 
como 


A-B-A -(B,%X+ By + B,2) 
= BA-&K+BA-J+BA-Z por aplicação das Equações (1.23a) e (1.23b) 
= BA, + BA, + BA, por substituição na Equação (1.22). 
Por conseguinte 


A-B=5 BA=> AB=B-A. (1.24) 


Se A = B na Equação (1.24), recuperamos a grandeza A = (5) A2)1/2 de A na Equação (1.6) pela 
Equação (1.24). 

É obvio, pela Equação (1.24), que o produto escalar trata A e B da mesma maneira, ou seja, é simétrico em A 
e B e é comutativo. Assim, alternativa e equivalentemente, podemos primeiro generalizar as Equações (1.22) para 
a projeção Ap de A na direção de um vetor B Æ 0, em que Ag = Acos6 = A -B,emque Ê = B/B éo vetor 
unitário na direção de B e 0 é o ângulo entre A e B, como mostra a Figura 1.7. De modo semelhante, projetamos 
A sobre B como B4 = B cos 0 = B - Â. Em segundo lugar, fazemos essas projeções simétricas em A e B, o que 
leva à definição 


A.B= A4ApB = ABA = AB cosð. (1.25) 


A lei distributiva na Equação (1.23a) é ilustrada na Figura 1.8, que mostra que a soma das projeções de B e C 
sobre A, Ba + C é igual à projeção de B + C sobre A, (B + C) 4. 
Segue das Equações (1.22), (1.24) e (1.25) que os vetores unitários das coordenadas satisfazem às relações 


X%=9.9=2-2=1, (1.263) 
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Figura 1.7: Produto escalar A - B = AB cos 6. 


Cc 


B+C l 


< (B+ Os > 


Figura 1.8: A lei distributiva A -(B + C) = AB4 + AC4 = A(B + C)4, Equação (1.23a). 


enquanto 
Xy=-%X-2=y7:2=0. (1.26b) 

Se a definição de componente, Equação (1.24), for rotulada como uma definição algébrica, então a 
Equação (1.25) é uma definição geométrica. Uma das aplicações mais comuns do produto escalar na física é 
no cálculo de trabalho = força-deslocamento- cos 0, que é interpretada como o deslocamento vezes a projeção 
da força ao longo da direção de deslocamento, isto é, o produto escalar da força e do deslocamento, W = F .- S. 

Se A-B = 0 e sabemos que A # 0e B Z 0, então, pela Equação (1.25), cos = 0 ou O = 90º,270º e 
assim por diante. Os vetores A e B devem ser perpendiculares. Alternativamente, podemos dizer que A e B são 
ortogonais. Os vetores unitários $, Y e 2 são mutuamente ortogonais. Para desenvolver um pouco mais essa noção 
de ortogonalidade, suponha que n seja um vetor unitário e r um vetor não-zero no plano xy, isto é, r = x£ + Yy 
(Figura 1.9). Se 


n:r=>0 


para todas as escolhas de r, então n deve ser perpendicular (ortogonal) ao plano xy. 
Muitas vezes é conveniente substituir $, Y e Z por vetores unitários com índices em, m = 1,2,3, com Å = ey 
e assim por diante. Então, as Equações (1.26a) e (1.26b) tornam-se 


Em ' en = dns (1.260) 


Para m Æ n, os vetores unitários €m € e, são ortogonais. Para m = n, cada vetor é normalizado à unidade, isto 
é, tem grandeza unitária. O conjunto €m é denominado ortonormal. Uma grande vantagem da Equação (1.26c) 
sobre as Equações (1.26a) e (1.26b) é que a Equação (1.26c) pode ser imediatamente generalizada para espaço 
N dimensional: m,n = 1,2,...,N. Por fim, estamos escolhendo conjuntos de vetores unitários em que são 
ortonormais por conveniência — uma conveniência muito grande. 


Invariância do Produto Escalar sob Rotações 
Ainda não mostramos que a palavra escalar é justificada ou que o produto escalar é, de fato, uma quantidade 
escalar. Para fazer isso, investigamos o comportamento de A - B sob a rotação do sistema de coordenadas. Pela 
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Figura 1.9: Um vetor normal. 


utilização da Equação (1.15), 
AL Bi + A,B} + AB, = 5 azii > zj Bj; + 5 Ayi Ai 5 ayjBj 
i j i j 
+) a4: X azjBj. (1.27) 
i j 
Usando os índices k e | para somar xy e z, obtemos 
SAB, = DDD aiA;m;B;, (1.28) 
k l i j 
e, rearranjando os termos do lado direto, temos 
k l i j i j i 


As últimas duas etapas são executadas utilizando a Equação (1.18), a condição de ortogonalidade dos co-senos 
diretores e as Equações (1.20), que definem o delta de Kronecker. O efeito do delta de Kronecker é cancelar todos 
os termos de um somatório para qualquer índice, exceto para o termo cujos índices são iguais. Na Equação (1.29) 
seu efeito é estabelecer j = i e eliminar o somatório em j. É claro que também podíamos, da mesma forma, 
estabelecer į = j e eliminar o somatório em %. A Equação (1.29) nos dá 


DS ALB, =} AB, (1.30) 
k i 


que é exatamente a nossa definição de uma quantidade escalar, uma quantidade que permanece invariante sob a 
rotação do sistema coordenado. 

Por uma abordagem similar que explora esse conceito de invariância, tomamos C = A + B e o multiplicamos 
escalarmente por ele mesmo: 


C-C=(A+B) (A+B) 
=A-A+B-B+2A-B. (1.31) 


Uma vez que 
C-C=C0C?, (1.32) 
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o quadrado da grandeza do vetor C e, por isso, uma quantidade invariante, vemos que 
1 
A.B= o (C? — A? — B?), invariante. (1.33) 


Uma vez que o lado direito da Equação (1.33) é invariante — isto é, uma quantidade escalar — , o lado esquerdo, 
A - B, também deve ser invariante sob rotação do sistema coordenado. Por conseguinte, A - B é um escalar. 
A Equação (1.31) é, na realidade, uma outra forma da lei dos co-senos, que é 


C? = A? + B? + 2AB cos8. (1.34) 


Comparando as Equações (1.31) e (1.34), temos uma outra verificação da Equação (1.25) ou, se preferirmos, uma 
derivação vetorial da lei dos co-senos (Figura 1.10). 


A 


Figura 1.10: A lei dos co-senos. 


O produto escalar, dado pela Equação (1.24), pode ser generalizado de duas maneiras. O espaço não precisa 
ficar restrito a três dimensões. Em um espaço n dimensional, a Equação (1.24) se aplica com a soma indo de 1 a 
n. Além do mais, n pode ser infinito, quando então a soma é uma série infinita convergente (Seção 5.2). A outra 
generalização estende o conceito de vetor para abranger funções. A função análoga de um produto escalar, ou 
interno, aparece na Seção 10.4. 


Exercícios 


1.3.1 Dois vetores de grandeza unitária e; e e; devem ser paralelos ou perpendiculares um ao outro. 
Mostre que e; - e; fornece uma interpretação da Equação (1.18), a relação de ortogonalidade do 
co-seno diretor. 

1.3.2 Dado que (1) o produto escalar de um vetor unitário por ele mesmo é a unidade e (2) essa relação é 
válida em todos os sistemas de coordenadas (rotacionados), mostre que Ñ’ - *' = 1 (com o sistema 
“linha”rotacionado de 45º ao redor do eixo z em relação ao sistema “sem linha”) implica que 
Xy=0. 

1.3.3 O vetor r, que inicia na origem, termina no ponto no espaço (x,y, z) e especifica esse ponto. Ache 
a superfície abrangida pela extremidade de r se 
(a) (r — a) -a = 0. Caracterize a geometricamente. 

(b) (r — a) -r = 0. Descreva o papel geométrico de a. 
O vetor a é constante (em grandeza e direção). 


1.3.4 A energia de interação entre dois dípolos de momentos ju, e pt, pode ser escrita na forma vetorial 


V= Hı ` Ho dE 3(mı -L)(Mo Tr) 


r3 r5 


e na forma escalar 


y ado 
F 


A (2 cos 84 cos 0, — sen Oisen 02 cos p). 


Aqui, 04 e 02 são os ângulos de u e u em relação a r, enquanto q é o azimute de p em relação 
ao plano de u;-r (Figura 1.11). Mostre que essas duas formas são equivalentes. 
Sugestão: A Equação (12.178) será útil. 
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1.3.5 Um cano desce em diagonal pela parede sul de um edifício, fazendo um ângulo de 45º com a 
horizontal. Ao chegar a uma quina da parede, o cano muda de direção e continua descendo na 
diagonal por uma parede leste, ainda fazendo um ângulo de 45º com a horizontal. Qual é o ângulo 
entre as seções do cano da parede sul e da parede leste? 


Resposta: 120º. 


Figura 1.11: Dois momentos dipolares. 


1.3.6 Ache a distância mais curta entre um observador no ponto (2,1,3) e um foguete em vôo livre com 
velocidade de (1,2,3) m/s. O foguete foi lançado do ponto (1,1,1) no tempo t = 0. As distâncias 
estão expressas em quilômetros. 


1.3.7 Prove a lei dos co-senos a partir do triângulo com vértices nos pontos C e A da Figura 1.10 e da 
projeção do vetor B sobre o vetor A. 


1.4 Produto de Vetores ou Produto Externo 


Uma segunda forma de multiplicação de vetores emprega o seno do ângulo incluído em vez do co-seno. Por 
exemplo, o momento angular de um corpo mostrado na ponta do vetor distância da Figura 1.12 é definido como 


y 


Momento linear Fá (9) 


Distância 
Braço do raio 


Figura 1.12: Momento angular. 


momento angular = braço do raio x momento linear 
= distância x momento linear x sen 6. 


Por conveniência no tratamento de problemas relacionados a quantidades tais como momento angular, torque e 
velocidade angular, definimos o produto vetorial ou produto externo como 


C=AxB, com O = ABsen 6. (1.35) 
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Diferente do caso anterior do produto escalar, C agora é um vetor e atribuímos a ele uma direção perpendicular ao 
plano de A e B, tal que A, Be C formam um sistema do dextrogiro. Com essa escolha de direção temos 


AxB=-Bxa, anticomutação. (1.36a) 


Por essa definição de produto externo, temos 


RxxX=yYxy=2x2=0, (1.36b) 
ao passo que 
Xxy=2 Yx2Z=% Z2x%X=7 
E UE Res do SC Rindo (1.360) 
ŷ x = 2, Z2xy=-&, Xx2Z=—%. 
Entre os exemplos de produtos externo na física matemática estão a relação entre o momento linear p e o 


momento angular L, com L definido como 
L=rxp, 


relação entre velocidade linear v e velocidade angular w, 
V=WxT. 


Os vetores v e p descrevem propriedades da partícula ou sistema físico. Contudo, o vetor posição r é determinado 
pela escolha da origem das coordenadas. Isso significa que w e L dependem da escolha da origem. 
A familiar indução magnética B costuma ser definida pela equação do produto vetorial da força” 


Fm = qv x B (unidades mks). 


Aqui, v é a velocidade da carga elétrica q e F m é a força resultante sobre a carga em movimento. 

O produto externo tem uma importante interpretação geométrica, que utilizaremos em seções subseqüentes. No 
paralelogramo definido por A e B (Figura 1.13), Bsen 0 é a altura se A for tomado como o comprimento da base. 
Então |A x B| = ABsen 0 é a área do paralelogramo. Como vetor, A x B é a área do paralelogramo definido 
por A e B, com o vetor de área normal ao plano do paralelogramo. Isso sugere que a área (com sua orientação no 
espaço) pode ser tratada como uma quantidade vetorial. 


y: 


Figura 1.13: Representação em paralelogramo do produto vetorial. 


Uma definição alternativa do produto vetorial pode ser derivada do caso especial dos vetores unitários 
coordenados nas Equação (1.36c) junto com a linearidade do produto externo em ambos os argumentos vetoriais, 


8 Aqui, admite-se que o campo elétrico E é zero. 
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por analogia com as Equações (1.23) para o produto escalar. 


Ax(B+C)=AxB+AXxC, (1.37a) 
(A+B)xC=AxC+BxC, (1.37b) 
A x (yB) = yA x B = (yA) x B, (1.37c) 


em que y é, mais uma vez, um número. Usando a decomposição de A e B em suas componentes cartesianas de 
acordo com a Equação (1.5), encontramos 
AxB C = (Cr, Cy, C2) = (Arf + Ay + 4,2) x (Brå + By + B,2) 
= (AsBy— AyBr)f x + (AB; — A-Br)å x ĉ 
+ (A,B: — A.By)y xX Ê, 


aplicando as Equações (1.37a) e (1.37b) e substituindo as Equações (1.36a), (1.36b) e (1.36c), de modo que as 
componentes cartesianas de A x B se tornam 


Cy = AB, — A,B,  Cy-A,B,- AB, C, = ABy- AyBs, (1.38) 


ou 
Ci = A; Bp — Ak Bj, i, j, k todos diferentes, (1.39) 


e com permutação cíclica dos índices i, j e k correspondendo a x, y e z, respectivamente. O produto vetorial C 
pode ser representado mnemonicamente por um determinante’ 


x y à 
A, A As A A 
C=| 4 4&4 A4 laa] AR o eal e Y, (1.40) 
B OB B B, B; B; B, B, B; 


que deve ser expandido pela linha superior para reproduzir as três componentes de C listadas nas Equações (1.38). 
A Equação (1.35) poderia ser denominada definição geométrica do produto vetorial. Então as Equações (1.38) 
seriam uma definição algébrica. 
Para mostrar a equivalência entre a Equação (1.35) e a definição de componente, as Equações (1.38), vamos 
formar os produtos A - C e B-C, usando as Equações (1.38). Temos 


A-C=A-(AxB) 
= A(A,B, — 4,By) + Ay(A.B, — A,B.) + A(AsB, — A,B») 
=0. (141) 


De modo semelhante, 
B.C=-B.(AxB)=0. (1.42) 


As Equações (1.41) e (1.42) mostram que C é perpendicular a ambos, A e B (cos = 0,0 = +90º) e, portanto, 
perpendicular ao plano que eles determinam. A direção positiva é determinada considerando casos especiais, tais 
como os vetores unitários È x y = 2 (C, = +4,B,). 

O módulo é obtido por 


(A xB)-(AxB)=42B2-(A-B) 
= A? B? — A? B? cos? 0 
= AºBºsen?6. (1.43) 


Por conseguinte, 
C = ABsen 8. (1.44) 


? Veja a Seção 3.1 para um breve resumo de determinantes. 


“livro” — 2007/81 — 15:06 — page 17 — #27 


ELSEVIER, 1. ANÁLISE VETORIAL 17 


A primeira etapa na Equação (1.43) pode ser verificada pela expansão na forma de componentes usando as 
Equações (1.38) para A x B e a Equação (1.24) para o produto escalar. Pelas Equações (1.41), (1.42) e (1.44), 
vemos a equivalência das Equações (1.35) e (1.38), as duas definições de produto vetorial. 

Resta ainda o problema de verificar que C = A x B é, de fato, um vetor, isto é, obedece à Equação (1.15), a 
lei de transformação vetorial. Iniciando em um sistema rotacionado (sistema “linha”), 


C; = A; Bp — AB, i,j, e k em ordem cíclica, 
= 5 ajA 5 akm Bm — 5 aki Ái 5 ajmBm 
l m l m 
= > (ajiagm — aklüjm) A Bm. (1.45) 
l,m 
A combinação de co-senos diretores entre parênteses desaparece para m = l. Por conseguinte, temos j e k 


assumindo valores fixos, dependendo da escolha de l e seis combinações de l e m. Sei = 3, então j = 1, k = 2, 
(ordem cíclica) e temos as seguintes combinações de co-senos diretores: !? 


Q11022 — 021012 = Q33, 
413421 — 423011 = Q32, (1.46) 
412023 — 422013 = Q31 


e seus negativos. As Equações (1.46) são identidades satisfeitas pelos co-senos diretores. Elas podem ser verificadas 
com a utilização de determinantes e matrizes (veja Exercício 3.3.3). Substituindo M na Equação (1.45), 


C} = a3341 B2 + a3243B1 + a31 Ao Bg — a33 42 B1 — a32 41 B3 — ası As Bo» 
= a3101 + a32C2 + a33C3 
> aznCn. (1.47) 


Permutando os índices para pegar C{ e C, vemos que a Equação (1.15) é satisfeita, e C é, de fato, um vetor. 
É preciso mencionar que essa natureza vetorial do produto externo é um acidente associado com a natureza 
tridimensional do espaço ordinário.!! Veremos, no Capítulo 2, que o produto cruzado também pode ser tratado 
como um tensor anti-simétrico de segunda ordem. 

Se definirmos um vetor como uma trinca ordenada de números (ou funções), como na última parte da Seção 
1.2, então não há problema algum em identificar o produto cruzado como um vetor. A operação de produto externo 
mapeia as duas trincas A e B para uma terceira trinca, C, que é, por definição, um vetor. 

Agora temos dois modos de multiplicar vetores: uma terceira forma aparece no Capítulo 2. Mas, e a divisão por 
um vetor? Acontece que a razão B/A não é exclusivamente especificada (Exercício 3.2.21), a menos que se exija 
que A e B sejam também paralelos. Por conseguinte, a divisão de um vetor por outro não é definida. 


Exercícios 


1.4.1 Mostre que as medianas de um triângulo se interceptam no centro, que está a 2/3 do comprimento 
da mediana a partir de cada vértice. Construa um exemplo numérico e represente-o em um gráfico. 


1.4.2 Prove a lei dos co-senos partindo de A? = (B — C)2. 
1.4.3 Começando com C = A + B, mostre que C x C = O leva a 


AxB--Bxa. 


1.4.4 Mostre que 
(a) (A-B)-(A+B)= 42 — B? 


10 As Equações (1.46) são válidas para rotações porque preservam volumes. Para uma transformação ortogonal mais geral, a do lado direito 
das Equações (1.46) é multiplicada pelo determinante da matriz de transformação (veja Capítulo 3 para matrizes e determinantes). 

N Especificamente, as Equações (1.46) são válidas apenas para o espaço tridimensional. Veja D. Hestenes e G. Sobczyk, Clifford Algebra to 
Geometric Calculus (Dordrecht: Reidel, 1984) para uma generalização mais ampla do produto externo. 
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1.4.10 


1.4.11 


1.4.12 


1.4.13 


(b) (A-B)x(A+B)=2A xB 
As leis distributivas necessárias aqui, 


A(B+OJ=A-B+4+A-C 


Ax(B+C)=AxB+AxC, 


podem ser verificadas com facilidade (se desejado) por expansão em componentes cartesianas. 


Dados os três vetores 


P =38 +29 -— Ê, 
Q = -62 — 49 +22, 
R=%-29-à, 


determine dois que são perpendiculares e dois que são paralelos ou antiparalelos. 


Se P = P, + Py e Q = Qr + YQ, são dois vetores não-paralelos quaisquer (também não- 
antiparalelos) no plano xy, mostre que P x Q está na direção z. 


Prove que (A x B) - (A x B) = (AB)? — (A - B)2. 


Usando os vetores 


P = Xcos0 + sen 0, 
Q = cos y — sen y, 
R = cos y + sen q, 


prove as familiares identidades trigonométricas 


sen(0 + p) = sen O cos y + cos sen g, 


cos(9 + p) = cos 8 cos py — sen sen q. 


(a) Ache um vetor A que é perpendicular a 


(b) O que é A se, além desse requisito, impusermos que ele tenha módulo unitário? 


Se quatro vetores a, b, c e d estiverem todos no mesmo plano, mostre que 
(a x b) x (c xd) = 0. 


Sugestão: Considere as direções dos vetores do produto externo. 


As coordenadas dos três vértices de um triângulo são (2, 1, 5), (5, 2, 8) e (4, 8, 2). Calcule sua área 
por métodos vetoriais, seu centro e medianas. Comprimentos em centímetros. 
Sugestão: Veja o Exercício 1.4.1. 


Os vértices do paralelogramo ABCD são (1,0,0), (2,—1,0),(0,—1,1) e (—1,0,1) na ordem. 
Calcule as áreas vetoriais do triângulo ABD e do triângulo BCD. As duas áreas vetoriais são 
iguais? 

Resposta: Área 4BD = —(R + + 22). 
A origem e os três vetores A, B e C (todos começando na origem) definem um tetraedro. Tomando 


a direção para fora como positiva, calcule a área vetorial total das quatro superfícies tetraédricas. 
Nota: Na Seção 1.11 esse resultado é generalizado para qualquer superfície fechada. 
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Figura 1.14: Triângulo esférico. 


1.4.14 Ache os lados e os ângulos do triângulo esférico ABC definido pelos três vetores 


Cada vetor tem início na origem (Figura 1.14). 


1.4.15 Derive a lei dos senos (Figura 1.15): 


Figura 1.15: Lei dos senos. 
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sena senf seny 


lAl IB] JC]? 
1.4.16 A indução magnética B é definida pela equação de força de Lorentz, 


F = q(v x B). 
Executando três experimentos, constatamos que, se 


V=, 


q 
F 

v=, >=44-4, 
q 

K F 

v=, — 


Pelos resultados desses três experimentos separados, calcule a indução magnética B. 


1.4.17 Defina um produto externos de dois vetores em espaço bidimensional e dê uma interpretação 
geométrica de sua construção. 

1.4.18 Ache a distância mais curta entre as trajetórias de dois foguetes em vôo livre. Admita que a trajetória 
do primeiro foguete r = rı + ti v1 com lançamento em rı = (1,1,1) e velocidade vı = (1,2,3) 
e que a trajetória do segundo foguete seja r = ro + tovo, com ro = (5,2,1) e vo = (—1,-1,1). 
Distâncias em quilômetros; velocidades em quilômetros por hora. 


1.5 Produto Escalar Triplo, Produto Vetorial Triplo 


Produto Escalar Triplo 
As Seções 1.3 e 1.4 abrangeram os dois tipos de multiplicação que nos interessam aqui. Contudo, há combinações 
de três vetores, A - (B x C) e A x (B x C), que ocorrem com freqüência suficiente para merecer mais atenção. 
A combinação 
A-(BxC) 

é conhecida como produto escalar triplo. B x C resulta em um vetor que, multiplicado escalarmente por A, 
dá um escalar. Notamos que (A - B) x C representa um escalar multiplicado em produto externo por um vetor, 
uma operação que não é definida. Por consegiiência, se concordarmos em excluir essa interpretação indefinida, os 
parênteses podem ser omitidos e o produto escalar triplo pode ser escrito como A -B x C. 

Usando as Equações (1.38) para o produto externo e a Equação (1.24) para o produto escalar, obtemos 


A-BxC=4A(B,C, — BO) + ABC, — B02) + A(B:Cy — ByCz) 
=B.CxA-C.AxB 
=-A-CxB=--C.BxA-=--B.AxC, eassim por diante. (1.48) 
Há um alto grau de simetria na expansão da componente. Cada termo contém os fatores A;, Bj e Cp. Sei, je k 


estiverem em ordem cíclica (x, y, z), O sinal é positivo. Se a ordem for anticíclica, o sinal é negativo. Além disso, 
o produto escalar e o produto externo podem ser permutados, 


A-BxC-AxB-C. (1.49) 


Uma representação conveniente da expansão de componentes da Equação (1.48) é dada pelo determinante 


As Ay 4 
A-BxC=|B, By B; |. (1.50) 
Cs C C 


As regras para permutar linhas e colunas de um determinante! fornecem uma verificação imediata das permutações 
listadas na Equação (1.48), enquanto a simetria de A, B e C na forma de determinante sugere a relação dada na 


2 veja a Seção 3.1 para um resumo das propriedades de determinantes. 
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Equação 1.49. Os produtos triplos encontrados na Seção 1.4, que mostraram que A x B era perpendicular a ambos, 
A e B, eram casos especiais do resultado geral (Equação (1.48)). 

O produto escalar triplo possui uma interpretação geométrica direta. Os três vetores A, B e C podem ser 
interpretados como definindo um paralelepípedo (Figura 1.16): 


zZ 
A 


Æ 


B 


>y 


X 


Figura 1.16: Representação em paralelepípedo do produto escalar triplo. 


|B x C| = BC'sen 0 


= área da base do paralelogramo. (1.51) 


A direção, é claro, é normal à base. Introduzir o produto escalar por A nessa expressão significa multiplicar a área 
da base pela projeção de A sobre a normal, ou seja, base vezes altura. Portanto, 


A: B x C = volume do paralelepípedo definido por A,B e C. 


O produto escalar triplo encontra uma aplicação interessante e importante na construção de um reticulado cristalino 
recíproco. Admitamos que a, b e c (não necessariamente mutuamente perpendiculares) representem os vetores que 
definem um reticulado cristalino. Então, o deslocamento de um ponto do reticulado para outro pode ser escrito 


r = Naa + nb + nec, (1.52) 
com Na, Ne € Ne assumindo valores inteiros. Com esses vetores podemos formar 


bxc cxa axb 
pa A SNE NA, fara E, fr ATN 
a abxe' p a-bxc' DO Go fraca) 


Vemos que a” é perpendicular ao plano que contém b e c, e podemos mostrar com facilidade que 


a.a=b'.b=c'.c-1, (1.53b) 


ao passo que 


a.b=a'.c=b'.a=b'.c=c'.a=c'.b=0. (1.53c) 


É por essas Equações (1.53b) e (1.53c) que o nome reticulado recíproco é associado com os pontos r’ = 


nla + nb’ + nice”. O espaço matemático no qual esse reticulado recíproco existe às vezes é denominado espaço 
de Fourier, com base em relações com a análise de Fourier apresentada nos Capítulos 14 e 15. Esse reticulado 
recíproco é útil em problemas que envolvem a dispersão de ondas pelos vários planos de um cristal. Mais detalhes 
podem ser encontrados em R. B. Leighton, Principles of Modern Physics, pp. 440-448 [Nova York: McGraw-Hill 
(1959)]. 


Produto Vetorial Triplo 
O segundo produto triplo de interesse é A x (B x C), que é um vetor. Aqui, os parênteses devem ser mantidos, 
como se pode verificar por um caso especial ($ x £) x y = 0, enquanto X x (£ x ĵ) = $ x ĉ = —ŷ. 
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Exemplo 1.5.1 UM PRODUTO VETORIAL TRIPLO 


Para os vetores 


x y ĉ 
BxC=|0 1 1|=&+$y-42, 
1 —1 0 
e 
xy 2 
Ax(BxC)=|1 2 =-2-2=-(9+9)-(R-9) 
1 1 — 


=-B-C. L] 
Reescrevendo o resultado na última linha do Exemplo 1.5.1 como uma combinação linear de B e C, notamos 


que, ao seguirmos uma abordagem geométrica, o produto vetorial triplo é perpendicular a A e B x C. O plano 
definido por B e C é perpendicular a B x C e, assim, o produto triplo está nesse plano (veja a Figura 1.17) 


Z 


Ax(BxC) 


X 


Figura 1.17: B e C estão no plano xy. B x C é perpendicular ao plano xy e é mostrado aqui ao longo do eixo z. 
Então, A x (B x C) é perpendicular ao eixo z e, por conseguinte, está de volta ao plano zy. 


Ax(BxC) =uB+vC. (1.54) 


Considerando que o produto escalar da Equação (1.54) com A resulta zero para o lado esquerdo, portanto, 
uA -B+vA-C = 0. Por conseguinte, u = wA : C ev = —wA - B para um w adequado. Substituindo 


esses valores na Equação (1.54), temos 


Ax(BxC)=v|B(A-C)-C(A -B)]: (1.55) 


queremos mostrar que 
w=1 


na Equação (1.55), uma importante relação também conhecida como regra BAC-CAB. Uma vez que a 
Equação (1.55) é linear em A, B e C, w é independente dessas grandezas. Isto é, precisamos apenas mostrar 
que w = 1 para vetores unitários A, B, C. Vamos denotar B - C = cosa, C- A = cos 6, A - B = cos y, e elevar 
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a Equação (1.55) ao quadrado para obter 


a 


[Â x (Ê x O] = Â? (Ê x É) — [Â (Bx O] 

= 1 — cos’ & — [À . (Ê x é)” 

=w? [(Â . ĉĉ)? + (å . Ê} -2(Ã -B)(Ã- CB - ĉ)] 

=w? (cos? B + cos? y — 2 cos a cos 8 cos y), (1.56) 


usando (À x Ê)? = Â? Ê? — (À . Ê)? repetidas vezes (veja Equação (1.43) para uma prova). Por conseqüência, 
o volume (ao quadrado) abrangido por A, B, C que ocorre na Equação (1.56) pode ser escrito como 


[À «B x é)” = 1 — cos? a — w? (cos? 8 + cos? y — 2cosacos 8 cos 7). 


Aqui, w? = 1, visto que esse volume é simétrico em a, 3,7. Isto é, w = +1 e é independente de Â, Ê, Ĉ. Usando 
mais uma vez o caso especial x ( x Y) = —ŷ na Equação (1.55), finalmente temos w = 1. (Uma derivação 
alternativa usando o símbolo de Levi-Civita c;;; apresentado no Capítulo 2 é o tópico do Exercício 2.9.8.) 

Poderíamos observar que, exatamente como vetores são independentes das coordenadas, também uma equação 
vetorial é independente do sistema de coordenadas particular. O sistema de coordenadas apenas determina as 
componentes. Se a equação vetorial puder ser estabelecida em coordenadas cartesianas, ela pode ser estabelecida 
e válida em qualquer dos sistemas de coordenadas que serão apresentados no Capítulo 2. Assim, a Equação (1.55) 
pode ser verificada por um método direto, se bem que não muito elegante, de expansão em componentes cartesianas 
(veja o Exercício 1.5.2). 


Exercícios 


1.5.1 Um dos vértices de um paralelepípedo de vidro está na origem (Figura 1.18). Os três vértices 
adjacentes estão em (3, 0,0), (0,0,2) e (0,3, 1). Todos os comprimentos são dados em centímetros. 
Calcule o número de centímetros cúbicos de vidro no paralelepípedo usando o produto escalar triplo. 


Z 


Figura 1.18: Paralelepípedo: produto escalar triplo. 


1.5.2 Verifique a expansão do produto vetorial triplo 
Ax(BxC)=B(A-C)-C(A -B) 


por expansão direta em coordenadas cartesianas. 


24 
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1.5.3 


1.5.4 


1.5.5 


1.5.6 


1.5.7 


1.5.8 


1.5.9 


1.5.10 


1.5.11 


Mostre que a primeira etapa na Equação (1.43), que é 
(A x B)- (A x B) = 42B2-(A-B), 


é consistente com a regra BAC-CAB para um produto vetorial triplo. 


São dados os três vetores A, Be C, 


(a) Calcule o produto escalar triplo, A -B x C. Observando que A = B + C, dê uma interpretação 
geométrica do seu resultado para o produto escalar triplo. 
(b) Calcule A x (B x ©). 


O momento angular orbital L de uma partícula é dado por L = r x p = mr x v, em que p é o 
momento linear. Com as velocidades linear e angular relacionadas por v = w x r, mostre que 


L = mr’ [w — êf- w)]. 


Aqui, ĉ é um vetor unitário na direção r. Para r - w = 0 isso se reduz a L = Iw, com o momento 
de inércia 7 dado por mr?2. Na Seção 3.5 esse resultado é generalizado para formar um tensor de 
inércia. 

1 


jmo’. Para o movimento de rotação, 


A energia cinética de uma única partícula é dada por T = 


essa expressão se transforma em im(w x r)2. Mostre que 


l 22 2 
T = mbrw - (r-w)?). 


Para r - w = 0 essa expressão se reduz a T = iIa’, com o momento de inércia 1 dado por mr?. 


Mostre que! 
ax(bxc)+bx(cxa)+ex(axb)=0. 


Um vetor A é decomposto em um vetor radial A, e um vetor tangencial A,. Se £ for um vetor 
unitário na direção radial, mostre que 


(a) A, =f(A -£)e 

(b) A; = —f x (î x A). 

Prove que uma condição necessária e suficiente para que os três vetores (não-nulos) A, B e C sejam 
coplanares é que o produto escalar triplo seja nulo 


A-BxC=0. 
Três vetores, A, Be C, são dados por 
A = 3R — 2 + 22, 
B = 6% + 4% — 22, 
C = —3 — 2% — 42. 
Calcule os valores de A -B x Ce A x (B x C),C x (A x B)eB x (Cx A). 
O vetor D é uma combinação linear de três vetores não-coplanares (e não-ortogonais): 


D=aA +bB + cC. 


Mostre que os coeficientes são dados por uma razão de produtos escalares triplos, 


 D-BxC 
“A-BxC' 


a e assim por diante. 


BEsta é a identidade de Jacobi para produtos vetoriais; para comutadores, é importante no contexto de álgebras de Lie (veja a Equação (4.16) 


na Seção 4.2). 
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1.5.12 Mostre que 
(AxB)-(CxD)=(A-C)(B-D)-(A-D)(B-.C). 


1.5.13 Mostre que 
(AxB)x(CxD)=(A-BxD)JC-(A-BxC)D. 
1.5.14 Para um triângulo, esférico, tal como o representado na Figura 1.14, mostre que 


sen Á sen B sen C 


sen BC senCA senAB 


Aqui, sen A é o seno do ângulo incluído em A, enquanto, BC é o lado oposto (em radianos). 


1.5.15 Dados 


A bxc j cxa ; axb 
a-———, =D, c = ——; 
a-bxc a-bxc a-bxc 


ea-bx c #0, mostre que 


(a) x- y'= ôry, (X, y = a,b,c), 
(b) a -b xc'=(a-bxe)1, 


1.5.16 Sex- y'= rsy, (X, y = a, b, c), prove que 


bxc 
q TESS, 
a-bxc 


(Este problema é o inverso do Problema 1.5.15.) 


1.5.17 — Mostre que qualquer vetor V pode ser expresso em termos dos vetores recíprocos 
a”, b',c' (do Problema 1.5.15) por 


V=(V.aa'+(V-b)b' + (Voce. 


1.5.18 Uma carga elétrica q; movendo-se com velocidade vı produz uma indução magnética B dada por 


B = —qı E (unidades mks), 
r 


em que £ aponta de q; para o ponto em que B é medido (lei de Biot e Savart). 


(a) Mostre que a força magnética sobre uma segunda carga q2, velocidade v2, é dada pelo produto 
vetorial triplo 


(b) Escreva a força magnética correspondente F; que q2 exerce sobre qı. Defina seu vetor unitário 
radial. Como F e F2 se comparam? 

(c) Calcule F; e Fə para o caso de q; e q2 se movimentarem ao longo de trajetórias paralelas lado 
a lado. 


Resposta: 
Ho 4192 A 

b) Fı = —— >>> vi x (vo x £). 
(b) Fi Pre (vo x £) 

Em geral, não há nenhuma relação simples entre 

F; and F2. Especificamente, a terceira lei de Newton, F = — FF», não se aplica. 

NI sa 

o F; = 2 vêr = —F». 
© = o 2 

Atração mútua. 
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1.6 Gradiente, V 


Para dar uma motivação para a natureza vetorial das derivadas parciais, apresentamos agora a variação total de 
uma função F(x,y), 


oF. ƏF 
aF = Sed + ga dy 


Ela consiste em variações independentes nas direções x e y. Escrevemos dF como uma soma de dois incrementos, 
um deles exclusivamente na direção x e o outro na direção y, 


dF(x,y) = F(x + de,y + dy) — F(x,y) 
= [F(x + dz, y + dy) — F(x,y + dy)| + [F(x, y + dy) — F(z, y)] 
F ƏF 


= —d — d 
dx gi Oy a 


somando e subtraindo F'(x,wy + dy). O teorema do valor médio (isto é, a continuidade de F`) nos diz que, aqui, 
OF /0x OF /0y são avaliadas no mesmo ponto É, entre x e x + dx, y e y + dy, respectivamente. À medida que 
da — 0e dy > 0, é — x em — y. Esse resultado se generaliza para três dimensões e para mais de três dimensões. 
Por exemplo, para uma função y de três variáveis, 


dolz, y,z) = [p(x + de,y + dy, z + dz) — (x,y + dy, z + dz)] 
+ Lola, y + dy, z + dz) — p(z, y, z + dz) 


+ [o(x,y, z + dz) — p(x,9y,2)] (1.57) 
_ 3p dp dy 
= dg + ad dg 


Algebricamente, dy na variação total é um produto escalar da mudança na posição dr e da mudança direcional de 
y. E agora estamos prontos para reconhecer a derivada parcial tridimensional como um vetor, o que nos leva ao 
conceito de gradiente. 

Suponha que (x,y,z) seja uma função escalar pontual, isto é, uma função cujo valor depende dos valores 
das coordenadas (x,y,z). Como um escalar, ela deve ter o mesmo valor em um dado ponto fixo no espaço, 
independente da rotação de nosso sistema de coordenadas, ou 


p' (£1, 29,23) = plan, T2, £3). (1.58) 
Diferenciando em relação a «x obtemos 
Op’ (11,23,83) _ OP(T1, T2, £3) dp dx; dy 


pelas regras da diferenciação parcial e Equações (1.16a) e (1.16b). Mas a comparação com a Equação (1.17), a 
lei de transformação vetorial, agora mostra que construímos um vetor com componentes 9 /0x;. Denominamos 
esse vetor gradiente de p. 

Um simbolismo conveniente é 


2.00 dp dp 
im + dy ER (1.60) 
ou 
o) „o O) 
Vi a (1.61) 


Vo (ou del y) é nosso gradiente do escalar y, enquanto o próprio V (del) é um operador diferencial vetorial 
(disponível para operar sobre um escalar y ou diferenciá-lo). Todas as relações para V (del) podem ser derivadas 
da natureza híbrida de del em termos das derivadas parciais, bem como de sua natureza vetorial. 

O gradiente de um escalar é de extrema importância em física e em engenharia para expressar a relação entre 
um campo de força e um campo de potencial, 


força F = — V (potencial V), (1.62) 
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que vale para campos gravitacionais, bem como para campos eletrostáticos, entre outros. Note que o sinal de menos 
na Equação (1.62) resulta em água fluindo montanha abaixo, em vez de montanha acima! Se uma força pode ser 
descrita, como na Equação (1.62), por uma única função V (r) em todos os lugares, denominamos a função escalar 
V seu potencial. Como a força é a derivada direcional do potencial, podemos achar o potencial, se ele existir, 
integrando a força ao longo de alguma trajetória adequada. Como a variação total dV = VV . dr = —F . dr 
é o trabalho realizado contra a força ao longo da trajetória dr, reconhecemos o significado físico do potencial 
(diferença) como trabalho e energia. Além do mais, em uma soma de incrementos de trajetória, os pontos 
intermediários se cancelam: 


[V(r + drı + dro) — V (r + dr1)| + [V(r + drı) — V (r)]| = V(r + dro + dry) — V (r), 


portanto, o trabalho integrado ao longo de alguma trajetória desde um ponto inicial r; até um ponto final r é 
dado pela diferença de potencial V(r) — V(r;) nos pontos extremos da trajetória. Portanto, essas forças são 
especialmente simples e bem comportadas: são denominadas conservativas. Quando houver perda de energia 
devido a atrito ao longo da trajetória, ou a algum outro tipo de dissipação, o trabalho dependerá da trajetória, 
e essas forças não poderão ser conservativas: não existe potencial. Discutiremos forças conservativas com mais 
detalhes na Seção 1.13. 


Exemplo 1.6.1 O GRADIENTE DE UM POTENCIAL V(r) 
Vamos calcular o gradiente de V (r) = V (y/£? + y? + 22), portanto, 


n 2V) e aV (r) F RAAN 


S ox y Oy oz 


Agora, V (r) depende de x por meio da dependência de r de x. Portanto, !4 


ƏV (r) = dV(r) Or 


da dr dx 
De r como uma função de x, y, z, temos 
ðr a +y +22)! z£ ai 
ðr dz (2 +y? +22) ro 


Portanto, 
V(r) V(r) zx 
ðr dr ro 


Permutando as coordenadas (x — y, y > 2,2 — x) para obter as derivadas de y e z, obtemos 


` E o NIdV 

VV(r) = (&r+yy+22) 
ae ano 
© rd dr 


Aqui, ĉ é um vetor unitário (r/r) na direção radial positiva. O gradiente de uma função de r é um vetor na 
direção radial (positiva ou negativa). Na Seção 2.5, 7 é visto como um dos três vetores unitários ortonormais de 
coordenadas esféricas polares e ĉ O/Ôr como a componente radial de V. E 


Uma Interpretação Geométrica 
Uma aplicação imediata de V resulta de seu produto escalar com um incremento de comprimento 


dr = R dz + Ẹ dy + ĉ dz. 


Esse é um caso especial da regra da cadeia da diferenciação: 


OV(r,0,0) ƏV Ər Və ƏV ðp 
əx Or de 39 ðr Op əx’ 


em que OV/00 = ƏV /ðp = 0,0V/ôOr > dV/dr. 
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Assim, obtemos 


Vy-dr = Res E dude La = dy, 
a 


o Oy Oz 


a mudança na função escalar correspondente a uma mudança na posição dr. Agora considere P e Q dois pontos 
sobre uma superfície p(x,y,z) = C, uma constante. Esses pontos são escolhidos de modo que Q está a uma 
distância dr de P. Então, indo de P a Q, a mudança em (x, y, z) = C é dada por 


do=(Vy)-dr=0, (1.63) 


desde que continuemos sobre a superfície y(x, y, z) = C. Isso mostra que Vo é perpendicular a dr. Uma vez que 
dr pode ter qualquer direção a partir de P, contanto que permaneça na superfície de y constante e o ponto Q é 
restrito à superfície mas tem direção arbitrária, V y é visto como normal à superfície p = constante (Figura 1.19). 


Z 
4 


Vo 
æy, z)=C 


Ey: 


X 


Figura 1.19: O incremento de comprimento dr tem de permanecer sobre a superfície y = C. 


Se agora permitirmos que dr nos leve de uma superfície y = Cı para uma superfície adjacente y = C2 
(Figura 1.20), 
dy =— Ci — C2 SACS (Vo) «dr. (1.64) 


p=C,>C, 


i 


+y 


Figura 1.20: Gradiente. 


Para um dado dọ, |dr| é um mínimo quando for escolhido paralelo a Vy (cos = 1) ou, para um dado [|dr|, a 
mudança na função escalar y é maximizada escolhendo dr paralelo a V(. Isso identifica V como um vetor que 
tem a direção da máxima taxa de mudança espacial de y, uma identificação que será útil no Capítulo 2 quando 
considerarmos sistemas coordenados não-cartesianos. Essa identificação de V também pode ser desenvolvida 
usando o cálculo de variações a um vínculo, Exercício 17.6.9. 
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Exemplo 1.6.2 Força como GRADIENTE DE UM POTENCIAL 


Como um exemplo específico do precedente e como uma extensão do Exemplo 1.6.1, consideramos as superfícies 
que consistem em cascas esféricas concêntricas, Figura 1.21. Temos 


xX 


Figura 1.21: Gradiente para (x,y,z) = (£? + y? + 2?)!/?, cascas esféricas: (£2 + y2 + 23)!/2 


Cola? +Y? + 2? 2)1/2 = r; = Cı. 


= To = 


p(z, y, z) = (a? +y’ j7 =r C, 


em que r é o raio, igual a C, nossa constante. AC = Ay = Ar, a distância entre duas cascas. Pelo Exemplo 1.6.1, 


O gradiente está na direção radial e é normal à superfície esférica y = C. 


Exemplo 1.6.3 INTEGRAÇÃO DE GRADIENTE POR PARTES 
Vamos provar a fórmula f A(r)- Vf(r) dir = — f f(r)V - A(r) dr, em que A ou f ou ambas se anulam no 
infinito de modo que as partes integradas são nulas. Essa condição é satisfeita se, por exemplo, A for o potencial 
vetorial eletromagnético e f for uma função de onda de estado ligado y(r). 

Escrevendo o produto interno em coordenadas cartesianas, integrando cada integral unidimensional por partes 
e desprezando os termos integrados, obtemos 


faw -Vfl a E | wars 
Meise iie 


Se A = e'*28 descreve um fóton saindo na direção do vetor unitário de polarização constante êe f = y(r) é uma 
função de onda de estado ligado que decai exponencialmente, então 


porque somente a componente z do gradiente contribui. E 
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Exercícios 


1.6.1 Se S(x, y, z) = (£? + y? + 22)3/2, ache 
(a) V S no ponto (1, 2, 3); 
(b) o módulo do gradiente de S, |V S| em (1, 2, 3); e 
(c) os co-senos diretores de VS em (1, 2,3). 


1.6.2 (a) Ache um vetor unitário perpendicular à superfície 
r? +y +2? =3 
no ponto (1, 1, 1). Comprimentos em centímetros. 
(b) Derive a equação do plano tangente à superfície em (1, 1, 1). 
Resposta: (a) ($ + ŷ + 2)/ v3, b) xr +y +2 =3. 


1.6.3 Dado um vetor r12 = (xı — £2) + (yı — y2) + Z(24 — z2), mostre que Vırı2 (gradiente com 
respeito a x1, yı € zı da grandeza r12) é um vetor unitário na direção de r12. 


1.6.4 Se uma função vetorial F depender de coordenadas espaciais (x, y, z) e também do tempo t, mostre 
que 
oF 
dF = (dr. V)F + — dt. 
ot 
1.6.5 Mostre que V (uv) = vV u + uVv, em que u e v são funções escalares diferenciáveis de x,y e 2. 


(a) Mostre que a condição necessária e suficiente para que u(x, y, 2) e v(x, y, z) sejam relacionadas 
por alguma função f(u, v) = 0 é que (Vu) x (Vv) = 0. 
(b) Seu = u(x,y) ev = v(x, y), mostre que a condição (Vu) x (Vv) = 0 resulta no jacobiano 


bidimensional 
7 C 
J(=) -|E &|=0 


Ly 


Admite-se que as funções u e v são diferenciáveis. 


1.7 Divergência, V 
A diferenciação de uma função vetorial é uma simples extensão da diferenciação de quantidades escalares. Suponha 
que r(t) descreva a posição de um satélite em algum tempo t. Então, para diferenciação em relação ao tempo, 


dr(t) o r(t+ At) — r(t) 
E as At 


= v, velocidade linear. 


Graficamente, mais uma vez temos a inclinação de uma curva órbita, ou trajetória, como mostra a Figura 1.22. 


y 


lim Ar 


At—=0 At V 


Figura 1.22: Diferenciação de um vetor. 


Se resolvermos r(t) em suas componentes cartesianas, dr/dt sempre se reduz diretamente a uma soma 
vetorial de não mais do que três derivadas escalares (para o espaço tridimensional). Em outros sistemas de 
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coordenadas (Capítulo 2), a situação é mais complicada, pois a direção dos vetores unitários não é mais constante. 
A diferenciação em relação às coordenadas espaciais é resolvida do mesmo modo que a diferenciação em relação 
ao tempo, como veremos nos parágrafos seguintes. 

Na Seção 1.6, V foi definido como um operador vetorial. Agora, dando atenção às suas propriedades vetoriais 
e diferenciais, deixamos que ele opere sobre um vetor. Primeiro, como um vetor, fazemos seu produto escalar por 
um segundo vetor para obter 


Vs Vy oV, 
V.V=— # - 1.65 
dx Oy Fo AM (03a) 
expressão conhecida como a divergência de V, que é um escalar, como discutido na Seção 1.3. 
Exemplo 1.7.1 DIVERGÊNCIA DE VETOR COORDENADO 
Calcule V - r: 
o o o 
V r= (2 +z +25) «(Ro + y + 22) 
dx ôy Oz 
poe sr + Rad a 
dx Oy Oz 
ou V.r=83. E 


Exemplo 1.7.2 DIVERGÊNCIA DE CAMPO DE FORÇA CENTRAL 


Generalizando o Exemplo 1.7.1, 


VEe) = goles] golo fo] + e] 
Cd Pd 2d 


= SU) r dr r dr r dr 
d 
= 3f(r) +r, 


A manipulação das derivadas parciais que levam à segunda equação no Exemplo 1.7.2 é discutida no Exemplo 
1.6.1. Em particular, se f(r) = r°71, 


vV. (rr”=t) =V. îr” 
= 3r”7l 4 (n — Do 
= (n+ 2)r"t. (1.65b) 


Essa divergência desaparece para n = —2, em r = 0, um fato importante na Seção 1.14. E 


Exemplo 1.7.3 INTEGRAÇÃO POR PARTES DA DIVERGÊNCIA 

Vamos provar a fórmula f f(r)V - A(r) dr = — f A - V f dr, em que A ou ou ambas se anulam no infinito. 
Para mostrar isso faremos, como no Exemplo 1.6.3, a integração por partes após escrever o produto interno em 

coordenadas cartesianas. Como os termos integrados são avaliados no infinito, em que são nulos, obtemos 


[ramer f (dayaz T6 dydedz + zdz de dy) 
y 


ox z 
of of of 
= - [agido dude + Ay dl dydedz + A. SLdedody) 
=-[A-Vfdêr. 
JE : 
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Uma Interpretação Física 

Para desenvolver uma percepção da significância física da divergência, considere V - (pv) com v(x,y,z) a 
velocidade de um fluido compressível e p(x, y, z) sua densidade no ponto (x, y, z). Se considerarmos um pequeno 
volume da dy dz (Figura 1.23) em « = y = z = 0, o fluido que escoa por esse volume por unidade de tempo 
(direção x positiva) pela face EFGH é (taxa de fluxo em) greu = PUzlz=o = dy dz. As componentes do fluxo 
Pvy € pvz tangenciais a essa face nada contribuem para o fluxo através dessa face. A taxa de fluxo de saída (ainda 
na direção x positiva) pela face ABCD é pvz|x=dx dy dz. Para comparar esses fluxos e achar o fluxo líquido de 
saída, expandimos esse último resultado, como a variação total na Seção 1.6.!º Isso resulta 


Z 
A 


dz 


=y 


Figura 1.23: Paralelepípedo retangular diferencial (no primeiro octante). 


(taxa de fluxo de saída) 4 gcp = pVz|x=ax dy dz 


(pur) dx dy dz. 


RE: 
= PUx 
ð x=0 


x 
Aqui, o termo da derivada é um primeiro termo de correção, que leva em conta a possibilidade de densidade não- 
uniforme ou velocidade não-uniforme ou ambas.!º O termo de ordem zero Pvz|r=0 (correspondente a um fluxo 
uniforme) é cancelado: 


o 
Velocidade líquida de fluxo de saída], = gz P=) dz dy dz. 
a 
De modo equivalente, podemos chegar a esse resultado por 
pvr(Az, 0, 0) = pvz(0, 0, 0) = Olpvelr, Y, z)] 


li = 
Azo Ax dx 


0,0,0 


Agora, o eixo x não está recebendo nenhum tratamento preferencial. O resultado precedente para as duas faces 
perpendiculares ao eixo x deve valer para as duas faces perpendiculares ao eixo y, com x substituído por y e a 
mudanças correspondentes para ye z: y — z, z — x. Essa é uma permutação cíclica das coordenadas. Mais 
uma outra permutação cíclica dá o resultado para as duas faces restantes de nosso paralelepípedo. Adicionando a 
velocidade de fluxo líquida para todos os três pares de superfícies de nosso elemento de volume, temos 


Fluxo líquido 


ð ð ð 
(por unidade de tempo) or (ova) + gy vu) ca gz P=) da dy dz 


= V - (pv) dz dy dz. (1.66) 


15 Aqui, temos o incremento dx e mostramos que uma derivada parcial em relação a pvz também pode depender de y e z. 

16Em termos estritos, Pva representa sobre a face EFGH e, de modo semelhante, a expressão pug +(0/0x)(pva) dx representa uma média 
sobre a face ABCD. Usando um volume diferencial arbitrariamente pequeno, constatamos que as médias se reduzem aos valores empregados 
aqui. 
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Por conseguinte, o fluxo de nosso fluido compressível que escoa do elemento de volume da dy dz por volume 
unitário por unidade de tempo é V - (pv). Daí o nome divergência. Uma aplicação direta é na equação de 
continuidade 
dp 
— +V. (pv)=0, (1.67a) 
ot 
que afirma que um fluxo líquido que escoa do volume resulta em uma diminuição densidade dentro do volume. 
Note que, na Equação (1.67a), p é considerada uma possível função de tempo, bem como do espaço. A divergência 
aparece em uma grande variedade de problemas físicos, abrangendo desde uma densidade de probabilidade de 
corrente em mecânica quântica até vazamento de nêutrons em um reator nuclear. 

A combinação p(x, y, z, t) na qual f é uma função escalar e V é uma função vetorial, pode ser escrita 


VV) = ÈV) + EUV) + EUV) 


óf oV; of oV, of oV; 
nad “op ay Dae ar 
=(VD-V+ÍfV-V, (1.67b) 


que é exatamente o que esperaríamos para a derivada de um produto. Note que V como um operador diferencial 
distingue ambas, f e V; como um vetor, ele é multiplicado escalarmente por V (em cada termo). 
Se tivermos o caso especial da divergência que se anula de um vetor a zero, 


v.B=0, (1.68) 


diz-se que o vetor B é solenoidal. O termo solenoidal vem do exemplo no qual B é a indução magnética e a 
Equação (1.68) parece com uma das equações de Maxwell. Quando um vetor é solenoidal, ele pode ser escrito 
como o rotacional de um outro vetor conhecido como o potencial vetorial. (Na Seção 1.13 calcularemos esse 
potencial vetorial.) 


Exercícios 


1.71 Para uma partícula que se movimenta em uma órbita circular, r = r coswt + Ẹrsen wt, 

(a) avalie r x t, com t = S = v. 

(b) Mostre que é + w2r = 0 com é = &. 

O raio r e a velocidade angular w são constantes. 
Resposta: (a) Zwr?. 

1.7.2 O vetor A satisfaz a lei de transformação vetorial, Equação (1.15). Mostre diretamente que sua 

derivada em relação ao tempo dA /dt também satisfaz a Equação (1.15) e é, portanto, um vetor. 
1.7.3 Mostre, por diferenciação das componentes, que 


(a) HLA-B)=A.B+A- Œ 


dt? 
dA dB 


(b) <(A x B) = % x B+ A x Sé, exatamente como a derivada do produto de duas funções 
algébricas. 

1.7.4 No Capítulo 2 veremos que os vetores unitários em sistemas de coordenadas não-cartesianos 
usualmente são funções das variáveis coordenadas, e; = e;(q1,42,43) e |e;| = 1. Mostre que 
de;/0q; = 0 ou ðe; /ðq; é ortogonal a e;. 
Sugestão: de? /0q; = 0. 

1.7.5 Prove que V.(axb)=b-(Vxa)-a-(Vxb). 
Sugestão: Trate como um produto escalar triplo. 


1.7.6 O campo eletrostático de uma carga pontual q é 


E= Í 
ÅTE0 


a bs» 


Calcule a divergência de E. O que acontece na origem? 
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1.8 Rotacional, V x 


Uma outra operação possível com o operador vetorial V é fazer o produto externo dele com um vetor. Obtemos 


vxv=a( v- gv) - Ev.) (gv Zv) 


dy * Oz dz ” Ox der ” Oy 
x y 2 

Sa | (1.69) 
Ve V; V; 


que é denominada a rotacional de V. Ao expandir esse determinante, devemos considerar a natureza de derivada 
de V. Especificamente, V x V é definido somente como um operador, um outro operador vetorial diferencial. 
Certamente não é igual, em geral, a —V x V.!” No caso da Equação (1.69), o determinante deve ser expandido de 
cima para baixo, de modo que obtenhamos as derivadas como mostrado na parte do meio da Equação (1.69). Se 
introduzirmos o produto externo de V no produto entre um escalar e um vetor, podemos mostrar que 


Yx (Ale = [EUY 509] 


oV, of Vy of 
A (1 Oy X y? f ðz aiv) 
= fV x V|e + (Vf) x Vle. (1.70) 
Se permutarmos as coordenadas x Y, y AEA x para pegar a componente y e então permutá-las uma 
segunda vez para pegar a componente z, então 


V x(fV)=fVYxV+(Vf)xV, (1.71) 


que é o produto vetorial análogo da Equação (1.67b). Mais uma vez, como um operador diferencial, V diferencia 
ambas, f e V. Como um vetor, ele faz um produto externo em V (em cada termo). 


Exemplo 1.8.1 POTENCIAL VETORIAL DE UM CAMPO CONSTANTE B 
Pela eletrodinâmica sabemos que V - B = 0, cuja solução geral é B = V x A, em que A(r) é denominado 
potencial vetor (de indução magnética), porque V-(V x A) = (V x V) -A = 0, como um produto escalar triplo 
com dois vetores idênticos. Essa última identidade não mudará se adicionarmos o gradiente de alguma função 
escalar ao potencial vetorial que, portanto, não é único. 

Em nosso caso, queremos mostrar que um potencial vetorial é A = 1(B xr). 

Usando a regra BAC-CBA juntamente com o Exemplo 1.7.1, constatamos que 


2V x A = V x (B x r) = (V - r)B — (B - V)r = 3B — B = 2B, 


em que indicamos, pela ordenação do produto escalar do segundo termo, que o gradiente ainda age sobre o vetor 
coordenado. E 


Exemplo 1.8.2  ROTACIONAL DE UM CAMPO DE FORÇA CENTRAL 
Calcule V x (rf(r)). Pela Equação (1.71), 


V x (rfr) =V xr + [Vf] xr. (1.72) 
Primeiro, 
R y 2 
Vxr=|  & &l=0 (1.73) 
£ y zZ 


Com esse mesmo espírito, se A for um operador diferencial, não é necessariamente verdade que A x A = 8. Especificamente, para o 
operador de momento angular da mecânica quântica, L = —i(r x V) encontramos que L x L = iL. Veja Seções 4.3 e 4.4 para mais 
detalhes. 
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Segundo, usando V f(r) = (df /dr) (Exemplo 1.6.1), obtemos 


d 
Vxrf(r)= Pixr=0. (1.74) 
dr 
Esse produto vetorial se reduz a zero, visto quer = fr e f x î = 0. E 


Para desenvolver uma percepção melhor do significado do rotacional, consideramos a circulação de fluido ao 
redor de um circuito fechado diferencial no plano xy, Figura 1.24. 


Figura 1.24: Circulação ao redor de um círculo fechado diferencial. 


Embora a circulação seja dada tecnicamente por uma integral vetorial de linha f V - dA (Seção 1.10), podemos 
estabelecer aqui as integrais escalares equivalentes. Vamos admitir que a circulação seja 


circulação | 534 = f væv) dst f Valey) dày 
1 2 


+ | Vale) dst f Vilas) dày. (1.75) 
3 4 


Os números 1, 2, 3 e 4 se referem aos segmentos de reta numerados na Figura 1.24. Na primeira integral, 
dAz = +dx; mas, na terceira integral, dA, = —da porque o terceiro segmento de reta é atravessado na direção 
negativa de x. De modo semelhante, dA, = +dy para a segunda integral, —dy para a quarta. Em seguida, os 
integrandos referem-se ao ponto (xo, yo) com uma expansão de Taylor! levando em conta o deslocamento do 
segmento de reta 3 em relação a 1 e o do segmento 2 em relação a 4. Para nossos segmentos de reta diferenciais, 
isso resulta em 


ƏV, 
circulação 554 = Vz (£0, Yo) de + [vuo wo) + da dy 
x 


Vz 
+ [valeo mo) t ay (—da) + Vylxo, yo)(—dy) 
oVy Vz 
= | -> — dz dy. 1.7 
( ox Oy ) Sea Gaio) 
Dividindo por dx dy, temos 
circulação por unidade de área = V x V|}. (1.77) 


A circulação!’ ao redor de nossa área diferencial no plano xy é dada pela componente z de V x V. Em princípio, o 
rotacional V x V em (£o, yo) poderia ser determinado inserindo uma roda propulsora (ou roda de pás) (diferencial) 
no fluido em movimento no ponto (xo, Yo). A rotação da pequena roda de pás seria uma medida do rotacional, e 
seu eixo estaria ao longo da direção de V x V, que é perpendicular ao plano da circulação. 
Usaremos o resultado, Equação (1.76), na Seção 1.12 para derivar o teorema de Stokes. Sempre que o rotacional 
de um vetor V se reduz a zero, 
VxV=o, (1.78) 


; V, p z SRS ; 
18 Aqui, Vy (£o + dz, yo) = Vy (£0, yo) + (o da + --- . Os termos de ordem mais alta serão descartados no limite, à medida que 
dx — 0. Um termo de correção para a variação de Vy com y é cancelado pelo termo correspondente na quarta integral. 
Em dinâmica dos fluidos V x V é denominado “vorticidade”. 
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V é denominado irrotacional. Os exemplos físicos mais importantes de vetores irrotacionais são a força 
gravitacional e a força eletrostática. Em cada caso, 


V=05=C5, (1.79) 
r r“ 

em que C é uma constante e £ é o vetor unitário na direção radial que aponta para fora. Para o caso gravitacional, 
temos C = —Gmimos, dado pela lei da gravitação universal de Newton. Se C = q1q2/47€0, temos a lei da 
eletrostática de Coulomb (unidades mks). Pode-se demonstrar que a força V dada na Equação (1.79) é irrotacional 
por expansão direta em componentes cartesianas, como fizemos no Exemplo 1.8.1. Uma outra abordagem é 
desenvolvida no Capítulo 2, no qual expressamos V x, o rotacional, em termos de coordenadas esféricas polares. 
Na Seção 1.13 veremos que, sempre que um vetor for irrotacional, ele pode ser escrito como o gradiente (negativo) 
de um potencial escalar. Na Seção 1.16, provaremos que um campo vetorial pode ser resolvido em uma parte 
irrotacional e em uma parte solenoidal (sujeita a condições no infinito). Em termos do campo eletromagnético isso 
corresponde à resolução em um campo elétrico irrotacional e em um campo magnético solenoidal. 

Para ondas em um meio elástico, se o deslocamento u for irrotacional, V x u = 0, ondas planas (ou ondas 
esféricas em grandes distâncias) se tornam longitudinais. Se u for solenoidal, V -u = 0, então as ondas tornam-se 
transversais. Uma perturbação sísmica produzirá um deslocamento que pode ser resolvido em uma parte solenoidal 
e em uma parte irrotacional (compare com a Seção 1.16). A parte irrotacional dá origem às ondas de terremoto 
longitudinais P (primárias). A parte solenoidal dá origem às ondas transversais mais lentas S (secundárias). 

Usando o gradiente, a divergência e o rotacional e, é claro, a regra BAC-CAB, podemos construir ou 
verificar um grande número de identidades vetoriais úteis. Para verificação, a completa expansão em componentes 
cartesianas é sempre uma possibilidade. Às vezes, se usarmos a percepção em vez de manipulação de componentes 
cartesianas, o processo de verificação pode ser drasticamente encurtado. 

Lembre-se de que V é um operador vetorial, uma criatura híbrida que satisfaz dois conjuntos de regras: 

1. regras vetoriais e 
2. regras de diferenciação parcial — incluindo diferenciação de um produto. 


Exemplo 1.8.3 GRADIENTE DE UM PRODUTO ESCALAR 
Verifique que 
V(A-B)=(B-V)A+(A-V)B+4+Bx(VxA)J+Ax(V x B). (1.80) 


Esse exemplo particular depende de reconhecer que V(A - B) é o tipo de termo que aparece na expansão 
BAC-CAB de um produto vetorial triplo, Equação (1.55). Por exemplo, 


Ax(VxB)=V(A-B)-(A-V)B, 


com o V diferenciando somente B, e não A. Pela comutatividade de fatores em um produto escalar, podemos 
permutar A e B e escrever 

Bx(VxA)J=V(A-B)-(B-VJA, 
agora com V diferenciando somente A, e não B. Somando essas duas equações, obtemos V diferenciando 
o produto A - B e a identidade, Equação (1.80). Essa identidade é frequentemente usada na teoria do 
eletromagnetismo. O Exercício 1.8.13 é uma ilustração simples. E 


Exemplo 1.8.4 INTEGRAÇÃO DO ROTACIONAL POR PARTES 
Vamos provar a fórmula f C(r) - (V x A(r)) dr = f A(r)- (V x O(r)) dr, em que A ou C ou ambas se 
anulam no infinito. 

Para mostrar isso, utilizamos, como nos Exemplos 1.6.3 e 1.7.3, integração por partes após escrever o produto 
interno e o rotacional em coordenadas cartesianas. Como os termos integrados se anulam no infinito, obtemos 


[Sm (Y x Am) dr 
o dA, DAN. dA. DAN dA,  0AN] ss 
= fe - o) tela ae) + Cl ge = aA 


OC oC oC, OC ðC ðC. 
= A RE a A A PAER s aa RE E A ACUN z dê? 
/| (5 w) (> e) (E Oy )| i 
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apenas rearranjando adequadamente os termos após a integração por partes. E 
Exercícios 

1.8.1 Mostre, por rotação de coordenadas, que as componentes do rotacional de um vetor se transformam 


1.8.10 


1.8.11 


1.8.12 


como um vetor. 
Sugestão: As identidades dos co-senos diretores da Equação (1.46) estão disponíveis conforme 
necessário. 


Mostre que u x v é solenoidal se u e v forem, cada um, irrotacionais. 

Se A é irrotacional, mostre que A x r é solenoidal. 

Um corpo rígido está girando com velocidade angular constante w. Mostre que a velocidade linear 
v é solenoidal. 


Se uma função vetorial f(x, y, z) não é irrotacional, mas o produto de f, e uma função escalar 
g(x, y, z) é irrotacional, mostre que, então, 


f.Vxf=0. 


Se (a) V = Vz (x, y) + Vy (x,y) e (b) V x V Æ 0, prove que V x V é perpendicular a V. 
Classicamente, o momento angular orbital é dado por L = r x p, em que p é o momento linear. Para 
passar da mecânica clássica para a mecânica quântica, substitua p pelo operador —i V (Seção 15.6). 


Mostre que o operador do momento angular da mecânica quântica tem componentes cartesianas (em 
unidades de A) 


Usando os operadores de momento angular dados anteriormente, mostre que eles satisfazem 
relações de comutação da forma 


Lz, Ly| = Lely — LyLe = ilz 
y y y 


e, portanto, 
LxL=iL. 


Essas relações de comutação serão consideradas mais adiante como definindo relações de um 
operador de momento angular — Exercício 3.2.15, exercício seguinte e Capítulo 4. 

Com a notação de colchetes de comutação [L,., Ly] = Li, — Ly Lz, O vetor do momento angular 
L satisfaz [Lz, Ly] = i Lz, etc., ou L x L = iL. 

Se dois outros vetores a e b comutarem um com o outro e com L, isto é, [a, b] = [a, L] = [b, L] 

0, mostre que 


la- L,b - L] = i(a x b) - L. 
Para A = Az (x,y,z) e B = £B, (x,y, z), avalie cada termo no vetor identidade 
V(A-B)=(B-V)A+(A-V)B+Bx(VxA)+Ax(V xB) 


e verifique se a identidade foi satisfeita. 


Verifique a identidade vetorial 
Vx(AxB)=(B.-V)A-(A-V)B-B(V-A)+A(V.-B). 
Como uma alternativa à identidade vetorial do Exemplo 1.8.3 mostre que 


V(A-B)=(AxV)xB+(BxV)xA+A(V-B)+B(V-A). 
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1.8.13 Verifique a identidade 
Ax(VxA)= SV(4?) —(A-VIA. 
1.8.14 Se A e B são vetores constantes, mostre que 
V(A-Bxr)=AxB. 


1.8.15 Uma distribuição de correntes elétricas cria um momento magnético constante m = const. A força 
sobre m em uma indução magnética externa B é dada por 


F= V x (B xm). 
Mostre que 
F = (m - V)B. 
Nota: Admitindo nenhuma dependência temporal dos campos, as equações de Maxwell resultam 
V x B = 0. Também V B = 0. 


1.8.16 Um dipolo elétrico de momento p está localizado na origem. O dipolo cria uma potencial elétrico 
em r dado por 


yr) = 2 


— 4reor? ` 
Ache o campo elétrico, E = -V 4 emr. 

1.8.17 O potencial vetorial A de um dipolo magnético, momento de dipolo m, é dado por A (r) = 
(uo/47)(ma x r/r3). Mostre que a indução magnética B = V x A é dada por 

_ m3- m) -m 

“47 rê Í 


Nota: O processo limitador que resulta em dipolos pontuais é discutido na Seção 12.1 para dipolos 
elétricos e na Seção 12.5 para dipolos magnéticos. 


B 


1.8.18 A velocidade do fluxo bidimensional de um líquido é dada por 
V= u(x, y) T şvlz, y) 
Se o líquido é incompressível e o fluxo é irrotacional, mostre que 


Odu v ðu Ou 


ðr dy Co dy ðr 
Essas são as condições de Cauchy-Riemann da Seção 6.2. 

1.8.19 A avaliação feita nesta seção das quatro integrais para a circulação omitiu termos da série de Taylor 
como 9V;./dx, ƏV, /Əy e todas as derivadas de segunda ordem. Mostre que 0V;./dx, OV,/Ôy se 
cancelam quando as quatro integrais são somadas e que os termos da derivada de segunda ordem 
são descartados no limite à medida que dx — 0, dy > 0. 

Sugestão: Calcule a circulação por unidade de área e então tome o limite dr — 0, dy — 0. 


1.9 Aplicações Sucessivas de V 
Agora já definimos gradiente, divergência e rotacional para obter vetor, escalar e quantidades vetoriais, 
respectivamente. Permitindo que V opere sobre cada uma dessas quantidades, obtemos 


aV- Vo, D)Vx Vo, OVV- V, 
OAV- VxV, e)V x(V xV), 


todas as cinco expressões envolvendo derivadas de segunda ordem e todas elas aparecendo nas equações 
diferenciais de segunda ordem da física matemática, em particular na teoria eletromagnética. 
A primeira expressão, V : V ọ, a divergência do gradiente, é denominada laplaciano de y. Temos 


ə ə ð do» dp ð 
V-Vo=(3 as qi o ja gp qo 
z y z dx Oy oz 


(1.81a) 
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Quando y é o potencial eletrostático, temos 
V.Vy=0 (1.81b) 


em pontos em que a densidade de carga reduz-se a zero, que é a equação de Laplace da eletrostática. Muitas vezes, 
4 M 4 x 2 é solo 
a combinação V - V é escrita V^ ou A na literatura européia. 


Exemplo 1.9.1 LAPLACIANO DE UM POTENCIAL 


Calcule V - VV(r). 
Referindo aos Exemplos 1.6.1 e 1.7.2, 


dv 24 RV 
YEN PEN o rdr T dr?" 


substituindo f(r) no Exemplo 1.7.2 por 1/r - dV/dr. Se V(r) = r”, essa expressão se reduz a 


V.Vvrº =n(n+ Dr, 


que se reduz a zero para n = 0 [V(r) = constante] e para n = —1; isto é, V(r) = 1/r é a solução da 
Equação de Laplace, V2V(r) = 0. Isso parar 0. Em r = 0, está envolvida uma função delta de Dirac 
(veja a Equação (1.169) e a Seção 9.7). E 


A expressão (b) pode ser escrita 


VxVy= 


YL O 

A Po w 
o 

SR Po <> 

A Po N> 


Expandindo o determinante, obtemos 


2 2 2 2 
vxve=3( 2 e)a rd e) 


Oy Oz O dy dz20x ðrðz 
2, 92 
2 = = 1.82 
+(e 2) 0, fe) 


admitindo que a ordem da diferenciação parcial pode ser permutada. Isso é verdade, contanto que essas derivadas 
parciais de segunda ordem de q sejam funções contínuas. Então, pela Equação (1.82), o rotacional de um gradiente 
é identicamente zero. Por conseguinte, todos os gradientes são irrotacionais. Note que o zero na Equação (1.82) vem 
como uma identidade matemática, independente de qualquer física. O zero na Equação (1.81b) é uma conseqiiência 
da física. 

A expressão (d) é um produto escalar triplo que pode ser escrito 


2 9 0 
dx Oy Oz 
= ð ə Ca] 
V-VvVxV=| 5 dy Əz (1.83) 
Vo W V, 
Novamente, admitindo continuidade de modo que a ordem de diferenciação seja irrelevante, obtemos 
V.VxV=-o0. (1.84) 


A divergência de um rotacional desaparece ou todos os rotacionais são solenoidais. Na Seção 1.16 veremos que os 
vetores podem ser resolvidos em partes solenoidais e partes irrotacionais pelo teorema de Helmholtz. 
As duas expressões restantes satisfazem a uma relação 


Vx(VxW=VV-.V-v- vv, (1.85) 


válida em coordenadas cartesianas (mas não em coordenadas curvas). Isso segue imediatamente da Equação (1.55), 
a regra BAC-CAB que reescrevemos, de modo que C apareça na extrema direita de cada termo. O termo V -VV 
não foi incluído em nossa lista, mas pode ser definido pela Equação (1.85). 
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Exemplo 1.9.2 EQUAÇÃO DE ONDA ELETROMAGNÉTICA 


Uma importante aplicação dessa relação vetorial (Equação 1.86) aparece na derivação da equação de onda 
eletromagnética. No vácuo, as equações de Maxwell tornam-se 


V.B=-0, (1.86a) 
V.E=0, (1.86b) 
oE 

VxB= — 1.86 

x EoMo ðt , ( c) 
oB 

V x E= -—. 1.86d 
E ( ) 
Aqui, E é o campo elétrico, B é a indução magnética, £o é a permissividade elétrica e 119 é a permeabilidade 
magnética (unidades SI), portanto coto = 1/c?, c sendo a velocidade da luz. A relação tem conseqiiências 


importantes. Como co, (ty podem ser medidos em qualquer referencial, a velocidade da luz é a mesma em qualquer 
referencial. 

Suponha que eliminemos B das Equações (1.87c) e (1.87d). Podemos fazer isso tomando o rotacional de ambos 
os lados da Equação (1.87d) e a derivada em relação ao tempo de ambos os lados da Equação (1.87c). Visto que as 
derivadas de espaço e tempo comutam, 


(9) oB 
BY xB=Vx DE 
obtemos 
“E 


A aplicação das Equações (1.86) e (1.87b) resulta 


0'E 
V: VE = eop gar (1.87) 


a equação vetorial da onda eletromagnética. Novamente, se E for expresso em coordenadas cartesianas, a 
Equação (1.87) se separa em três equações escalares de onda, cada uma envolvendo o laplaciano escalar. 

Quando carga elétrica e densidades de corrente externas são mantidas como termos dominantes nas equações 
de Maxwell, equações de onda similares são válidas para o potencial elétrico e para o potencial vetor. Para mostrar 
isso, resolvemos a Equação (1.86a) escrevendo B = V x A como uma espiral do potencial vetorial. Essa expressão 
é substituída na lei da indução de Faraday em forma diferencial, Equação (1.86d), para resultar V x (E + 2) =0. 
O rotacional que desaparece implica que E + sa é um gradiente e, portanto, pode ser escrito como — V y, em que 
(r,t) é definido como o potencial elétrico (não-estático). Esses resultados para os campos B e E 


A 
B=VxA, BSES go (1.88) 
resolvem as equações homogêneas de Maxwell. 
Agora mostramos que as equações não-homogêneas de Maxwell, 
: ; 1 ðE 
lei de Gauss: | V - E = p/£ọ, lei de Oersted: | V x B — Dos Hod , (1.89) 
c 


em forma diferencial levam a equações de onda para os potenciais y e A, contanto que V - A seja determinado 
pela restrição 3 ae + V- A = 0. Essa opção por fixar a divergência do potencial vetorial, denominada calibre 
de Lorentz, serve para desvincular as equações diferenciais de ambos os potenciais. Esse vínculo de calibre não é 
uma restrição; não tem nenhum efeito físico. 

Substituindo nossa solução do campo elétrico na lei de Gauss temos 


P-vE=Vp-2v.A=-Np+ 


Ea Ji ZDE ’ (120) 
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a equação de onda para o potencial elétrico. Na última etapa utilizamos o calibre de Lorentz para substituir a 
divergência do potencial vetor pela derivada em relação ao tempo do potencial elétrico e assim desvincular y de 
A. 

Por fim, substituímos B = V x A na lei de Oersted e usamos a Equação (1.85), que expande V? em termos 
de uma componente longitudinal (o termo gradiente) e de uma componente transversal (o termo rotacional). Isso 
resulta 


2 1 dp 2 A 
eo dai dedo o alvit 22 j’ 


em que usamos a solução do campo elétrico (Equação (1.88)) na última etapa. Agora vemos que a condição do 
calibre de Lorentz elimina os termos de gradiente, de modo que a equação de onda 


1 8A 


2 
552 VA = pl (1.91) 


para o potencial vetor permaneça. 
Por fim, voltando à lei de Oersted, tomando a divergência da Equação (1.89), desprezando V - (V x B) = 0, 


e substituindo a lei de Gauss por V - E = p/€o, encontramos uy V - J = —s Se, em que egg = 1/C2, isto é, a 


equação de continuidade para a densidade de corrente. Essa etapa justifica a inclusão da corrente de deslocamento 
de Maxwell na generalização da lei de Oersted para situações não-estacionárias. E 


Exercícios 
1.9.1 Verifique a Equação (1.85), 


Vx(VxV)=VV-V-V- VV, 


por expansão direta em coordenadas cartesianas. 
1.9.2 Mostre que a identidade 
vV x(VxV)=VV. V-V. VV 
resulta da regra BAC-CAB para um produto vetorial triplo. Justifique qualquer alteração da ordem 
de fatores nos termos BAC e CAB. 
1.9.3 Prove que V x (VV) = 0. 


1.9.4 Dado que o rotacional de F é igual ao rotacional de G, mostre que a diferença entre F e G pode 
ser (a) uma constante e (b) um gradiente de uma função escalar. 


1.9.5 A equação de Navier-Stokes da hidrodinâmica contém um termo não-linear (v - W)v. Mostre que 
o rotacional desse termo pode ser escrito como —V x |v x (V x v)]. 

1.9.6 Da equação de Navier-Stokes para o fluxo constante de um fluido viscoso incompressível, temos o 
termo 


Vx[vx(Vxv)], 


em que v é a velocidade do fluido. Mostre que esse termo reduz-se a zero para o caso especial. 


v=%u(y,2). 


1.9.7 Prove que (Vu) x (Vv) é solenoidal, em que u e v são funções escalares diferenciáveis. 
1.9.8 p é um escalar que satisfaz a equação de Laplace, V2 = 0. Mostre que Vp é solenoidal e também 
irrotacional. 
1.9.9 Sendo 1) uma função escalar (de onda), mostre que 
o? o 
(r x V). (rx Viy =r? V?y — r’? Toa Ta 
ðr? ðr 


(Na verdade, isso pode ser demonstrado com mais facilidade em coordenadas esféricas polares, 
Seção 2.5.) 
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1.9.10 | Em uma massa isolada (não-rotacional), tal como uma estrela, a condição para equilíbrio é 
VP+p9Vp=0. 


Aqui, P é a pressão total, p é a densidade e y é o potencial gravitacional. Mostre que, a qualquer 
ponto dado, as normais às superfícies de pressão constante e potencial gravitacional constante são 
paralelas. 


1.9.11 Na teoria do elétron de Pauli, encontramos a expressão 
(p-eA) x (p— eA)y, 


em que +) é uma função (de onda) escalar e A é o potencial vetor magnético relacionado à indução 


magnética B por B = V x A. Dado que p = —iV, mostre que essa expressão se reduz a ieBy. 
Mostre que isso leva ao g fator orbital gr = 1 escrevendo o momento magnético como p = gL 
em unidades de magnetons de Bohr e L = —ir x V. Veja também Exercício 1.13.7. 


1.9.12 — Mostre que qualquer solução da equação 
Vx(VxA)-KA-=0 
satisfaz automaticamente a equação de Helmholtz 
VÍA+KA=0 
e a condição solenoidal 
V-A=0. 
Sugestão: Deixe V- operar na primeira equação. 
1.9.13 A teoria da condução de calor leva a uma equação do tipo 
V2y = kV OZ, 


em que & é um potencial que satisfaz à equação de Laplace: V26 = 0. Mostre que uma solução 
dessa equação é 


1 
Y = kd, 
2 


1.10 Integração Vetorial 

A etapa seguinte após a diferenciação de vetores é integrá-los. Vamos começar com integrais de linha e então 
prosseguir com integrais de superfície e de volume. Em cada caso, o método de ataque será reduzir as integrais 
vetoriais a integrais escalares, com as quais supomos que o leitor esteja familiarizado. 


Integrais de linha 
Usando um incremento de comprimento dr = $ dx + y dy + 2 dz, podemos encontrar as integrais de linha 


/ ydr, (1.92a) 

c 
V.dr, (1.92b) 

(6) 
Vxdr. (1.92c) 

c 


Em cada uma dessas expressões a integral é sobre algum contorno C' que pode ser aberto (ponto inicial e ponto 
final separados) ou fechado (formando um circuito fechado). Por causa de sua interpretação física apresentada a 
seguir, a segunda forma, Equação (1.92b), é, de longe, a mais importante das três. 

Com y, um escalar, a primeira integral se reduz imediatamente a 


fons] alma) do+9 f els 2) dy+ê | p(z, y, z) dz. (1.93) 
G C C C 
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Essa separação empregou a relação 


fRedo= | pas, (1.94) 


que é permissível porque os vetores unitários cartesianos $, Y e Z são constantes em módulos, bem como em 
direção. Talvez essa relação seja óbvia nesse caso, mas não será nos sistemas não-cartesianos encontrados no 
Capítulo 2. 

As três integrais do lado direito da Equação (1.93) são integrais escalares comuns, e, para evitar complicações, 
admitimos que elas são integrais de Riemann. Contudo, note que a integral em relação a x não pode ser avaliada 
a menos que y e z sejam conhecidos em termos de x, e o mesmo vale para as integrais em relação a y e 2. 
Isso significa simplesmente que o trajeto de integração C deve ser especificado. A menos que o integrando tenha 
propriedades especiais, de modo que a integral dependa somente do valor das extremidades, o valor dependerá da 
escolha particular do contorno C. Por exemplo, se escolhermos o caso muito especial de y = 1, a Equação (1.91a) 
é apenas a distância vetorial desde o início do contorno C até a extremidade, nesse caso independente da escolha 
de trajeto conectando as extremidades fixas. Com dr = % dx + Y dy + 2 dz, a segunda e a terceira formas também 
se reduzem a integrais escalares e, como na Equação (1.92a), são dependentes, em geral, da escolha do trajeto. A 
forma (Equação (1.92b)) é exatamente a mesma encontrada quando calculamos o trabalho realizado por uma força 
que varia ao longo do trajeto. 


W= fe -dr = J Paana da + f Prana dy + | Elena dz. (1.95a) 
Nessa expressão, F é a força exercida sobre uma partícula. 


Exemplo 1.10.1 TRABALHO DEPENDENTE DO TRAJETO 
A força exercida sobre um corpo é F = —%y + Yx. O problema é calcular o trabalho realizado quando se vai da 
origem ao ponto (1,1): 


11 1,1 
W = F-ar= [ (—y dz + z dy). (1.95b) 
0,0 0,0 


Separando as duas integrais, obtemos 


1 1 
w=- f vde+ f x dy. (1.95c) 
0 0 


A primeira integral não pode ser avaliada até que especifiquemos os valores de y quando x vai de O a 1. Da mesma 
forma, a segunda integral requer que x seja uma função de y. Considere, em primeiro lugar, o trajeto mostrado na 
Figura 1.25. Então 


1 1 
w=- [ Odo + f Idy=1, (1.95d) 
0 0 


yA 


d, 1) 


4,0) 


Figura 1.25: Um trajeto de integração. 


y = 0 ao longo do primeiro segmento do trajeto e x = 1 ao longo do segundo. Se selecionarmos o trajeto 
[z = 0,0 < y < 1ļJe [0 < xz < 1,y = 1], então a Equação (1.95c) dá W = —1. Para essa força, o trabalho 
realizado depende da escolha do trajeto. 
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Integrais de Superfície 

Integrais de superfície aparecem nas mesmas formas que integrais de linha, sendo o elemento de área também 
um vetor, do .?º Esse elemento de área costuma ser escrito ndA, no qual n é um vetor unitário (normal) para 
indicar a direção positiva.?! Há duas convenções para escolher a direção positiva. Na primeira, se a superfície 
for uma superfície fechada, concordamos em tomar a direção normal para fora como positiva. Na segunda, se a 
superfície for uma superfície aberta, a normal positiva depende da direção na qual o perímetro da superfície aberta 
é percorrido. Se os dedos da mão direita forem colocados na direção do percurso ao redor do perímetro, a normal 
positiva será indicada pelo polegar da mão direita. Como ilustração, o círculo no plano xy (Figura 1.26) mapeado 
de x para y para —x para —y e de volta para x terá sua normal positiva paralela ao eixo z positivo (para o sistema 
de coordenadas dextrogiras). 


>N 


Figura 1.26: Regra da mão direita para a normal positiva. 


Análogas às integrais de linha, Equações (1.92a) a (1.92c), as integrais de superfície podem aparecer nas formas 


Joao, frias. fN xao. 


Mais uma vez, o produto escalar é, de longe, a forma mais comumente encontrada. A integral de superfície f V -do 
pode ser interpretada como um escoamento ou fluxo através da superfície dada. E isso foi o que realmente fizemos 
na Seção 1.7 para obter a significância do termo de divergência. Essa identificação reaparece na Seção 1.11 como 
teorema de Gauss. Note que, em termos físicos, bem como pelo produto escalar, as componentes tangenciais da 
velocidade nada contribuem para o fluxo através da superfície. 


Integrais de Volume 
Integrais de volume são um tanto mais simples, porque o elemento de volume dr é uma quantidade escalar. ?? 


Temos 
[vasf vaars | Vyar +3 | de (1.96) 
V V V V 


novamente reduzindo a integral vetorial a uma soma vetorial de integrais escalares. 


Definições Integrais de Gradiente, Divergência e Rotacional 
Uma aplicação interessante e significativa de nossas integrais de superfície e volume é sua utilização no 
desenvolvimento de definições alternativas de nossas relações diferenciais. Encontramos 


f pdo 
=i 1.97 
Vi farco fdr E 
V.V= lim rdr (1.98) 
Jár>o fdr 
do x V 
yayami ES (1.99) 
Jdr=0 fdr 


20Lembre-se de que na Seção 1.4 a área (de um paralelogramo) é representada por um vetor de produto externo. 
2lEmbora n sempre tenha comprimento unitário, sua direção pode perfeitamente ser uma função da posição. 
2 Os símbolos d?r e d3 x costumam ser usados para denotar um elemento de volume em espaço de coordenadas (xyz ou x 123). 
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Nessas três equações, f dr é o volume de uma pequena região do espaço e do é o elemento de área vetorial desse 
volume. A identificação da Equação (1.98) como a divergência de V foi realizada na Seção 1.7. Aqui, mostramos 
que a Equação (1.97) é consistente com nossa definição anterior de Vy (Equação (1.60)). Por simplicidade, 
escolhemos dr como o volume diferencial dx dy dz (Figura 1.27). Desta vez, colocamos a origem no centro 
geométrico de nosso elemento de volume. A integral de área leva a seis integrais, uma para cada uma das seis faces. 
Lembrando que do aponta para fora, do - & = —|do| para a superfície EFHG e +|do| para a superfície ABDC, 
temos 


Figura 1.27: Paralelepípedo retangular diferencial (origem no centro). 


P LA dp d 
pdo = -3 | (ES z) dudz+s f G — Z) dyaz 
/ EFHG dx 2 ABDC +a 2 
a a M 
—y — > — | dedz + + — | dedz 
lan ðy 2 Bruo Oy? 


-2 f (e-25) dedy+ê f (o+ EE) zay 
ABFE o CDHG Oz 2 


Usando as variações totais, avaliamos cada integrando na origem com uma correção incluída para corrigir o 
deslocamento (+dx/2, etc.) do centro da face em relação à origem. Tendo escolhido o volume total como de 
tamanho diferencial (f dr = dx dy dz), abandonamos os sinais de integral no lado direito e obtemos 


fede Ae DO nado (1.100) 
ox Oy oz 


Dividindo por 
J dr = dz dy dz, 


verificamos a Equação (1.97). 

Essa verificação foi supersimplificada ao ignorar outros termos de correção além das derivadas de primeira 
ordem. Esses termos adicionais, que são introduzidos na Seção 5.6, quando é desenvolvida a expansão de Taylor, 
desaparecem no limite 


fo 0 (dx > 0, dy > 0, dz > 0). 


Essa, é claro, é a razão para especificar que esse limite fosse tomado nas Equações (1.97), (1.98) e (1.99) . A 
verificação da Equação (1.99) segue exatamente essas mesmas linhas, utilizando um volume diferencial da dy dz. 


46 
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Exercícios 


1.10.1 


1.10.2 


1.10.3 


1.10.4 


1.10.5 


1.10.6 


O campo de força que age sobre um oscilador linear bidimensional pode ser descrito por 
F = —&hka — ky. 

Compare o trabalho realizado movimentando-se contra esse campo de força entre (1,1) a (4,4) 
pelos seguintes trajetos em linha reta: 
(a) (1,1) > (4,1) > (4,4) 
©) (1,1) > (1,4) = (4,4) 
(c) (1,1) — (4,4) ao longo de z = y. 

Isso significa avaliar 


(4,4) 
-f F. dr 
(1,1) 


Ache o trabalho realizado para percorrer um círculo unitário no plano xy: 


ao longo de cada trajeto. 


(a) no sentido anti-horário de 0 a 7, 
(b) no sentido horário de O a —7, realizando trabalho contra um campo de força dado por 
—&y ya 
x2 + y2 z2 + y2 É 


Note que o trabalho realizado depende do trajeto. 
Calcule o trabalho que você realiza para ir de um ponto (1,1) a um ponto (3,3). A força que você 
exerce é dada por 
F = (x — y) + (z +y). 
Especifique claramente o trajeto que escolheu. Note que esse campo de força é não-conservativo. 
Avalie $ r - dr. 
Nota: O símbolo $ significa que o trajeto de integração é um circuito fechado. 


5 [do 


sobre o cubo unitário definido pelo ponto (0,0,0) e as interceptações unitárias sobre os eixos x, y 
e z positivos. Note que (a) r - do é zero para três das superfícies e (b) cada uma das três superfícies 
restantes contribui com a mesma quantidade para a integral. 


Avalie 


Mostre, por expansão da integral de superfície, que 


Sugestão: Escolha o volume f dr como um volume diferencial dx dy dz. 


1.11 Teorema de Gauss 

Aqui derivamos uma relação útil entre uma integral de superfície de um vetor e a integral de volume da divergência 
daquele vetor. Vamos admitir que o vetor V e suas derivadas de primeira ordem sejam contínuos sobre a região 
simplesmente conectada (que não tem orifício, tal como o de uma rosquinha) de interesse. Então, o teorema de 
Gauss afirma que 


V-do = |] V.Vdr. (1.101a) 
ƏV v 


Traduzindo em palavras, a integral de superfície de um vetor sobre uma superfície fechada é igual à integral de 
volume da divergência daquele vetor integrada sobre o volume incluído pela superfície. 

Imagine que o volume V seja subdividido em um número arbitrariamente grande de pequeninos paralelepípedos 
(diferenciais). Para cada paralelepípedo 


5 V.do=V- Vdr, (1.101b) 
seis superfícies 
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> + 


Figura 1.28: Cancelamento exato de dø sobre superfícies interiores. Nenhum cancelamento sobre a superfície 
exterior. 


pela análise da Seção 1.7, Equação (1.66), substituindo pv por V. O somatório é executado sobre as seis faces do 
paralelepípedo. Fazendo o somatório para todos os paralelepípedos, constatamos que os termos V -dø se cancelam 
(aos pares) para todas as faces interiores; somente as contribuições das superfícies exteriores (Figura 1.28) 
sobrevivem. Análogo à definição de uma integral de Riemann como o limite de uma soma, tomamos o limite no 
qual o número de paralelepípedos se aproxima do infinito (— oo) e as dimensões de cada um se aproximam de 
zero(— 0): 


» V- do S V-Vdr 
superfícies exteriores volumes 
fs V -do = JV- Vdr. 


O resultado é a Equação (1.101a), o teorema de Gauss. 

De um ponto de vista físico, a Equação (1.66) determinou V - V como o fluxo líquido de saída de fluido por 
unidade de volume. A integral de volume então dá o fluxo de saída líquido total. Mas a integral de superfície 
J V - do é apenas outra maneira de expressar essa mesma quantidade, que é a igualdade, o teorema de Gauss. 


Teorema de Green 


Um corolário do teorema de Gauss frequentemente usado é uma relação conhecida como teorema de Green. Se u 
e v são duas funções escalares, temos as identidades 


VQ(uVo)=uV.Vo+(Vu)- (Vo), (1.102) 
V. (vVu) =V Vu + (Vv). (Vu). (1.103) 


Subtraindo a Equação (1.103) da Equação (1.102), integrando sobre um volume (u, v e suas derivadas, admitidas 
como contínuas) e aplicando a Equação (1.101a) (teorema de Gauss), obtemos 


ff tus Vo-vuV.Vu)dr = ff Vv — vVu)- do. (1.104) 


Esse é o teorema de Green. Nós o utilizamos para desenvolver funções de Green no Capítulo 9. Uma forma 
alternativa do teorema de Green, derivada apenas da Equação (1.102), é 


(a) uvo-do = |f| uv -Vudr+ |) Vu. Vvdr. (1.105) 
aV v v 


Essa é a forma do teorema de Green usada na Seção 1.16. 
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Formas alternativas do Teorema de Gauss 
Embora a Equação (1.101a) envolvendo a divergência seja, de longe, a forma mais importante do teorema de 
Gauss, integrais de volume envolvendo o gradiente e o rotacional também podem aparecer. Suponha 


V(x,y,2) = V(x,y,2)a, (1.106) 


no qual a é um vetor de módulo constante e direção constante, porém arbitrária. (Você escolhe a direção, porém, 
tão logo a escolha, conserve-a fixa.) A Equação (1.101a) torna-se 


a fhVdo= ||| vcavár=a: |f| vvar (1.107) 


pela Equação (1.67b). Essa expressão pode ser reescrita como 


(a) va- Jf Vvar| =o. (1.108) 
ƏV v 


Visto que |a| # 0 e sua direção são arbitrários, significando que o co-seno do ângulo incluído nem sempre pode 
desaparecer, os termos entre colchetes devem ser zero.” O resultado é 


Vdo = [| VV dr. (1.109) 
ov v 


De maneira semelhante, usando V = a x P no qual a é um vetor constante, podemos mostrar 


f do xP = |) V x Pdr. (1.110) 
ƏV v 


Essas duas últimas formas do teorema de Gauss são usadas na forma vetorial da teoria da difração de Kirchoff. 
Elas também podem ser usadas para verificar as Equações (1.97) e (1.99). O teorema de Gauss também pode ser 
estendido para tensores (veja a Seção 2.11). 


a: 


Exercícios 
1.11.1 Usando o teorema de Gauss, prove que 


ff do =0 


Se S = ƏV for uma superfície fechada. 


1.11.2 Mostre que 
1 
3 fh, r: do = V, 


em que V é o volume contido pela superfície fechada S = oV. 
Nota: Essa é uma generalização do Exercício 1.10.5. 


1.11.3 Se B= V x A, mostre que 
ff B- do =0 


1.11.4 Sobre algum volume V seja q) uma solução da equação de Laplace (com as derivadas aparecendo 
como contínuas). Prove que a integral sobre qualquer superfície fechada em V da derivada normal 


de y (3y /Ən ou Vy - n) será zero. 


1.11.5 Por analogia com a definição integral de gradiente, divergência e rotacional da Seção 1.10, mostre 
que 


para qualquer superfície fechada S. 


Essa exploração da natureza arbitrária de uma parte de um problema é uma técnica valiosa e muito utilizada. O vetor arbitrário é usado 
novamente nas Seções 1.12 e 1.13. Outros exemplos aparecem na Seção 1.14 (integrandos igualados) e na Seção 2.8, sobre regra do quociente. 
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1.11.6 | O vetor deslocamento elétrico D satisfaz a equação de Maxwell V.D = p, em que p é a 
densidade de carga (por unidade de volume). Na fronteira entre dois meios há uma densidade de 
carga superficial o (por unidade de área). Mostre que uma condição de fronteira para D é 
(D2 — D;)-n=o, 
em que n é um vetor normal à superfície e está fora do meio 1. 
Sugestão: Considere uma caixinha como a mostrada na Figura 1.29. 
Figura 1.29: Caixinha. 
1.11.7 Pela Equação (1.67b), com V o campo elétrico E e f o potencial eletrostático y, mostre que, para 
integração sobre todo o espaço, 
frear = co [ E? dr. 
Isso corresponde a uma integração tridimensional por partes. 
Sugestão: E = -V ọ, V - E = p/£o. Você pode admitir que y se reduz a zero quando r é grande, 
pelo menos tão rapidamente quanto r~t. 

1.11.8 Uma determinada distribuição de corrente elétrica estacionária está localizada no espaço. 
Escolhendo uma superfície de fronteira longe o suficiente para que a densidade de corrente J seja 
zero em todos os pontos da superfície, mostre que 

flfsar=o. 
Sugestão: Tome uma componente de J por vez. Com V - J = 0, mostre que J; = V - (x;J) e 
aplique o teorema de Gauss. 

1.11.9 Pode-se demonstrar que a criação de um sistema localizado de correntes elétricas estacionárias 
(densidade de corrente J) e campos magnéticos pode requerer uma quantidade de trabalho 

1 
W=- H. Badr. 
2 
Transforme isso em i 
W=o- J Adr. 
2 
Aqui À é o potencial vetor magnético: V x A = B. 
Sugestão: Nas equações de Maxwell tome o termo corrente de deslocamento D /ðt = 0. Se os 
campos e correntes forem localizados, pode-se tomar uma superfície limitadora longe o suficiente 
para que as integrais dos campos e correntes sobre a superfície resultem zero. 
1.11.10 Prove a generalização do teorema de Green: 


J | fi (vLu — u£v) dr = Sh p(vVu— uv»): do. 


Aqui £ é o operador auto-adjunto (Seção 10.1), 
L=V. [p(r)V] +q(r) 
e p,q, u e v são funções da posição, sendo que p e q têm derivadas de primeira ordem contínuas e u 


e v têm derivadas de segunda ordem contínuas. 
Nota: Esse teorema de Green generalizado aparece na Seção 9.7. 
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1.12 Teorema de Stokes 


O teorema de Gauss relaciona a integral de volume de uma derivada de uma função com uma integral da função 
sobre a superfície fechada que limita o volume. Aqui consideramos a relação análoga entre a integral de superfície 
de uma derivada de uma função com a integral de linha da função sendo o trajeto de integração o perímetro da 
superfície limitadora. 

Vamos tomar a superfície e subdividi-la em uma rede de retângulos arbitrariamente pequenos. Na Seção 
1.8 mostramos que a circulação ao redor de tal retângulo diferencial (no plano xy) é V x Vl]. dx dy. Pela 
Equação (1.76) aplicada a um retângulo diferencial, 


se V.dAã=VxV-do. (1.111) 


quatro lados 


Somamos todos os pequenos retângulos, como na definição de uma integral de Riemann. As contribuições de 
superfície (lado direito da Equação (1.111)) são somadas. As integrais de linha (lado esquerdo da Equação (1.111)) 
de todos os segmentos de reta interiores se cancelam identicamente. Somente a integral de linha ao 
redor do perímetro sobrevive (Figura 1.30). Tomando o limite usual à medida que o número de retângulos se 
aproxima do infinito enquanto dx — 0, dy — 0, temos 


dA 


Figura 1.30: Cancelamento exato nos trajetos interiores. Nenhum cancelamento no trajeto exterior. 


e. do Y  VxV-.do 
RE reta retângulos 


fui | YxV do. 
S 


Esse é o teorema de Stokes. A integral de superfície à direita é sobre a superfície limitada pelo perímetro ou 
contorno, para a integral de linha à esquerda. A direção do vetor que representa a área está fora do plano do papel 
apontando para o leitor se a direção da transversal ao redor do contorno para a integral de linha estiver no sentido 
matemático positivo, como mostrado na Figura 1.30. 

Essa demonstração do teorema de Stokes é limitada pelo fato de termos usado uma expansão de Maclaurin 
de V(x,y,z) ao estabelecer a Equação (1.76) na Seção 1.8. Na verdade, basta exigir que o rotacional de 
V(x, y, z) exista e que seja integrável sobre a superfície. Uma prova do teorema da integral de Cauchy análoga 
ao desenvolvimento do teorema de Stokes feito aqui, porém usando essas condições menos restritivas, aparece na 
Seção 6.3. 

É óbvio que o teorema de Stokes se aplica a uma superfície aberta. É possível considerar uma superfície fechada 
um caso-limite de uma superfície aberta com a abertura (e, portanto, o perímetro) decrescendo para zero. Esse é o 
assunto do Exercício 1.12.7. 


(1.112) 
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Formas Alternativas do Teorema de Stokes 
Assim como no teorema de Gauss, outras relações entre integrais de superfície e de linha são possíveis. 


Encontramos 
fioxvo=4 p dA (1.113) 
S os 


[lioxv)xP= é dà x P. (1.114) 
s os 


A Equação (1.113) pode ser verificada com facilidade pela substituição V = a, na qual a é um vetor de módulo 
constante e direção constante, como na Seção 1.11. Substituindo no teorema de Stokes, Equação (1.112), 


[iv xap: da=- [axve-do 

S s 

= -a | Vox do. (1.115) 
S 


Para a integral de linha, 


f ap:dà=a: f pda, (1.116) 
os os 


a: ($ pda | Voxdo) =0. (1.117) 
os S 


Uma vez que a escolha da direção de a é arbitrária, a expressão entre parênteses deve se anular, verificando assim a 
Equação (1.113). A Equação (1.114) pode ser derivada de forma semelhante usando V = a x P, na qual a é, mais 
uma vez, um vetor constante. Podemos usar o teorema de Stokes para derivar as leis de Oersted e Faraday a partir 
de duas das equações de Maxwell e vice-versa, reconhecendo assim que as primeiras são uma forma integrada das 
últimas. 


obtemos 


Exemplo 1.12.1 LEIS DE OERSTED E FARADAY 


Considere o campo magnético gerado por um fio elétrico que transporta uma corrente I. Partindo da lei diferencial 
de Maxwell V x H = J, Equação (1.89) (com a corrente de deslocamento de Maxwell OD /ôt = 0 para o caso 
de uma corrente estacionária pela lei de Ohm), integramos sobre uma área fechada S perpendicular ao fio e o 
envolvendo e aplicamos o teorema de Stokes para obter 


T= [3:do= | (Y xH): do = H- dr, 
S S os 


que é a lei de Oersted. Aqui, a integral de linha é ao longo de ðS, a curva fechada que circunda a área da seção 
transversal S. 

De modo semelhante, podemos integrar a equação de Maxwell para V x E, Equação (1.86d), para resultar a lei 
da indução de Faraday. Imagine movimentar um circuito fechado (09) de fio (de área S) através de um campo de 
indução magnética B. Integramos a equação de Maxwell e usamos o teorema de Stokes, resultando 


B-dr= | (V x E) -do = -£ B.do = -—-—, 


que é a lei de Faraday. A integral de linha do lado esquerdo representa a voltagem induzida no circuito fechado de 
fio, enquanto o lado direito é a mudança ao longo do tempo do fluxo magnético & através da superfície móvel .S 
do fio. E 


Os teoremas de Stokes e de Gauss são de grande importância em uma ampla variedade de problemas que 
envolvem cálculo vetorial. Podemos ter uma idéia de seu poder e versatilidade pelos exercícios das Seções 1.11 e 
1.12 e pelo desenvolvimento da teoria do potencial nas Seções 1.13 e 1.14. 
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Exercícios 
1.12.1 Dado um vetor t = —Xy + y«, mostre, com a ajuda do teorema de Stokes, que a integral ao redor 
de uma curva fechada contínua no plano xy, 


1 1 
TEO > Edu- ydo) = Á, 
é a área limitada pela curva. 


1.12.2 O cálculo do momento magnético de um circuito fechado de corrente leva à integral de linha 


frxdr. 


(a) Integre ao redor do perímetro de um circuito de corrente (no plano xy) e mostre que a grandeza 
escalar dessa integral de linha é duas vezes a área da superfície envolvida. 

(b) O perímetro de uma elipse é descrito por r = ĝa cos 0 + ybsen 0. Pela parte (a), mostre que a 
área da elipse é mab. 


1.12.3 Avalie $ r x dr usando a forma alternativa do teorema de Stokes dada pela Equação (1.114): 


[ido xv)xP = parxP: 


Considere que o circuito está inteiramente sobre o plano xy. 


1.12.4 Em estado estacionário o campo magnético H satisfaz à equação de Maxwell V x H = J, em que 
J é a densidade de corrente (por metro quadrado). Na fronteira entre dois meios há uma densidade 
superficial de corrente K. Mostre que uma condição de fronteira em H é 


nx (H —- Hı) = K 


em que n é um vetor unitário normal à superfície e fora do meio 1. 
Sugestão: Considere um circuito estreito perpendicular à interface, como mostrado na Figura 1.31. 


io 2 
n meio 


meio 1 


Figura 1.31: Trajeto de integração na fronteira de dois meios. 


1.12.5 Pelas equações de Maxwell, V x H = J, sendo que, neste caso, J é a densidade de corrente e 
E = 0, mostre por essa relação, que 


frar=1, 


em que 1 é a corrente elétrica líquida contida pela integral do circuito fechado. Essas são as formas 
diferencial e integral da lei de Ampére do magnetismo. 


1.12.6 Uma indução magnética B é gerada por corrente elétrica em um anel de raio R. Mostre que o 
módulo do potencial vetor A (B = V x A) no anel pode ser 


p 
A iss 
AS so 


em que y é o fluxo magnético total que passa pelo anel. 
Nota: A é tangencial ao anel e pode ser mudado pela adição do gradiente de uma função escalar. 


1.12.7 Prove que 
VxV.do =0, 
S 


se 9 for uma superfície fechada. 
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1.12.8 Avalie + r - dr (Exercício 1.10.4) pelo teorema de Stokes. 


1.12.9 Prove que 
f Vv: da=- ovu- aa. 


fuvo -dà = [vo x (Vv) - do. 


1.12.10 Prove que 


1.13 Teoria do Potencial 


Potencial Escalar 
Se uma força sobre uma dada região simplesmente conexa do espaço S (o que significa que ela não tem orifícios) 
puder ser expressa como o gradiente negativo de uma função escalar p, 


F=-Vy, (1.118) 


denominamos y um potencial escalar que descreve a força por uma só função em vez de três. Um potencial escalar é 
determinado a menos de uma constante aditiva, a qual pode ser usada para ajustar seu valor no infinito (usualmente 
zero) ou em algum outro ponto. A força F que aparece como o gradiente negativo de um potencial escalar de 
valor único é denominada força conservativa. Queremos saber quando existe uma função potencial escalar. Para 
responder a esta pergunta, estabelecemos duas outras relações como equivalentes à Equação (1.118). São elas 


VxF=0 (1.119) 


fF-ar=0, (1.120) 


para todo trajeto fechado em nossa região simplesmente conectada S. Vamos mostrar que cada uma dessas três 
equações implica as outras duas. Comecemos com 


F=-Vo. (1.121) 


Então 
VxF=>-VxVp=0 (1.122) 


pela Equação (1.82) ou Equação (1.118) implica Equação (1.119). Retornando à integral de linha, temos 


frar=-dvo-dr=- dar, (1.123) 


usando a Equação (1.118). Agora, dy pode ser integrado para dar y. Visto que especificamos um circuito 
fechado, as extremidades coincidem e obtemos zero para todo trajeto fechado em nossa região S para a qual 
a Equação (1.118) for válida. Aqui é importante notar a restrição de que o potencial tenha um valor único e 
que a Equação (1.118) seja válida para todos os pontos em S. Esse problema pode surgir ao usar um potencial 
magnético escalar, um procedimento perfeitamente válido, contanto que nenhuma corrente líquida esteja envolvida. 
Tão logo escolhamos um trajeto no espaço que envolva uma corrente líquida, o potencial magnético escalar deixa 
de ter um valor único e nossa análise não se aplica mais. 

Continuando essa demonstração de equivalência, vamos admitir que valha a Equação (1.120). Se $ F - dr = 0 
para todos os trajetos em S, vemos que o valor da integral que une dois pontos distintos A e B é independente do 


trajeto (Figura 1.32). Nossa premissa é que 
f F.dr=0. (1.124) 
ACBDA 


/ pedr=— | podr= f F. dr, (1.125) 
ACB BDA ADB 


invertendo o sinal pela inversão da direção de integração. Em termos físicos, isso significa que o trabalho realizado 
para ir de A a B é independente do trajeto e que o trabalho realizado para percorrer um trajeto fechado é zero. E 
por essa razão que denominamos essa força conservativa: a energia é conservada. 


Portanto, 
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Figura 1.32: Possíveis trajetos para realizar trabalho. 


Com o resultado mostrado na Equação (1.125), temos que o trabalho realizado depende somente das 
extremidades A e B. Isto é, 


B 
Trabalho realizado pela força = | F.dr= (4) — (B). (1.126) 
A 


A Equação (1.126) define um potencial escalar (em termos estritos, a diferença de potencial entre os pontos A 
e B) e fornece um meio para calcular o potencial. Se o ponto B for tomado como uma variável, digamos (x,y, z), 
então a diferenciação em relação a x, y e z recuperará a Equação (1.118). 

A escolha de sinal para o lado direito é arbitrária. Aqui, a escolha é feita para obter concordância com a 
Equação (1.118) e para garantir que a água correrá montanha abaixo e não montanha acima. Para os pontos A 
e B separados por uma distância dr, a Equação (1.126) se torna 


F dr = -dy = -V y dr , (1.127) 
que pode ser reescrita como 
(EF +Vọ)-dr=0, (1.128) 


e, visto que dr é arbitrária, a Equação (1.118) deve resultar. Se 


fraco, (1.129) 


podemos obter a Equação (1.119) usando o teorema de Stokes (Equação (1.112): 


frear [vxr-do. (1.130) 


Se tomarmos o trajeto de integração como o perímetro de uma área diferencial arbitrária do, o integrando na 
integral de superfície deve se anular. Daí a Equação (1.120) implica a Equação (1.119). 

Por fim, se V x F = 0, basta inverter nosso enunciado do teorema de Stokes (Equação (1.130)) para 
derivar a Equação (1.120). Então, pelas Equações (1.126) a (1.128) é derivado o enunciado inicial F = -V ọ. 
A tripla equivalência é demonstrada (Figura 1.33). Resumindo, uma função potencial escalar de valor único 
y existe se e somente se F for irrotacional ou o trabalho executado ao redor de todo o circuito fechado for 
zero. Os campos de força gravitacional e eletrostática, dados pela Equação (1.79), são irrotacionais e, portanto, 
conservativos. Potenciais escalares gravitacionais e eletrostáticos existem. Agora, calculando o trabalho realizado 
(Equação (1.126)), passamos a determinar três potenciais (Figura 1.34). 


Exemplo 1.13.1 POTENCIAL GRAVITACIONAL 


Ache o potencial escalar para a força gravitacional sobre uma massa unitária ma, 


Gmama? kî 
7 E 


Es (1.131) 


T 
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F = -Vọ (1.118) 
V xF=0 (1.119) = qi razoa 
— 


Figura 1.33: Formulações equivalentes de uma força conservativa. 


> 6 


PsHo 


>r 


FG 


Pe 


Figura 1.34: Energia potencial versus distância (gravitacional, centrífuga e do oscilador harmônico simples). 
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dirigida radialmente para dentro. Integrando a Equação (1.118) de infinito até a posição r, obtemos 


pelr) — palo) --[ Po dr=+ f FG. dr. (1.132) 
Utilizando Fg = —Faplicada, UMa comparação com a Equação (1.95a) mostra que o potencial é o trabalho 


realizado para trazer a massa unitária do infinito. (Podemos definir apenas diferença de potencial. Neste caso, 
determinamos arbitrariamente que o potencial no infinito é zero. A integral do lado direito da Equação (1.132) é 
negativa, o que significa que pa (1) é negativo. Visto que F' é radial, obtemos uma contribuição para y somente 


quando dr é radial ou 
® kdr k Gmm 
alr) = onn . 


tä r r 


O sinal negativo final é uma conseqüência da força de atração da gravidade. E 


Exemplo 1.13.2 POTENCIAL CENTRÍFUGO 


Calcule o potencial escalar para a força centrífuga por massa unitária, Fo = w2rf, dirigida radialmente para 
fora. Em termos físicos, você poderia sentir essa força em um grande disco giratório horizontal de um parque de 
diversões. Procedendo como no Exemplo 1.13.1, mas integrando da origem para fora e tomando p«(0) = 0, temos 


4 wr? 
pol) =- | Fo:dr= "25. 
0 


Se invertermos os sinais, tomando Fsgo = —kr, obtemos Ysgo = tkr?, o potencial oscilador harmônico 
simples. 

Os potenciais gravitacional, centrífugo e do oscilador harmônico simples são mostrados na Figura 1.34. Fica 
claro que o oscilador harmônico simples produz estabilidade e descreve uma força restauradora. O potencial 
centrífugo descreve uma situação instável. E 


Termodinâmica — Diferenciais Exatas 
Em termodinâmica, que às vezes é denominada uma procura por diferenciais exatas, encontramos equações da 
forma 


df = P(x,y) de + Q(x, y) dy. (1.133a) 


O problema usual é determinar se f (P(x,y) dx + Q(x, y) dy) depende somente das extremidades, isto é, se df é, 
de fato, uma diferencial exata. A condição necessária e suficiente é que 


ga Es 


df = dz da + dy (1.133b) 
ou que 
P(x,y) = 0f/0%, 
1.133 
Q(z, y) = 3f /ðy. a 
As Equações (1.133c) dependem de satisfazer a relação 


Oy dx 


Contudo, isso é exatamente análogo à Equação (1.119), a exigência de que F' seja irrotacional. De fato, a 
componente z da Equação (1.119) resulta 


oF; 0H, 
= 1.1 
Dy de” (1.133e) 
com 
of of 
Dies alpes, 
da “Oy 
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Potencial Vetorial 
Em alguns ramos da física, em especial a eletrodinâmica, é conveniente introduzir um potencial vetor A, tal que o 
campo (de força) B seja dado por 

B=Vxa. (1.134) 


É claro que, se a Equação (1.134) valer, V - B = 0 pela Equação (1.84) e B é solenoidal. Aqui, queremos 
desenvolver um inverso, para mostrar que, quando B é solenoidal, existe um potencial vetor A. Demonstramos a 
existência de A calculando-o. Suponha B = £b + bz + 2bs e nosso desconhecido A = %a, + Ya» + Zag. Pela 
Equação (1.134), 


das das = 
Oy = Əz = bi, (1.135a) 
da das Re 
L cb, (1.135b) 
das da Ea 
o ge = bo (1.135c) 


Vamos admitir que as coordenadas foram escolhidas de modo que A é paralelo ao plano yz; isto é, ay = 0.2 
Então, 


das 
ia 
dao (1.136) 
3 dr 


Integrando, obtemos 


as =[ ba dz + fo(y, z), 
TOig (1.137) 
az=- | bzdz+ fs(y,z), 


zo 
em que fo e f3 são funções arbitrárias de y e z mas não são funções de x. Essas duas equações podem ser 
verificadas diferenciando e recuperando a Equação (1.136). A Equação (1.135a) se torna? 


das das pa (> + w) di a fz fə 


Oy Õz Oy Oz Oy Oz 
7 Oby ðfs Of 
= d 1.138 
dus OF me dy əz’ ( ) 
usando V : B = 0. Integrando em relação a x, obtemos 
das das dfs Of 
—— — + =b —b —. 1.139 
Oy Oz 1(x,y, 2) 1(£0, y, Z) + Oy oz ( ) 
Lembrando que f3 e f2 são funções arbitrárias de y e z, escolhemos 
f2 = 0, 
(1.140) 


y 
ka bı(z0,y, 2) dy, 

Yo 
de modo que o lado esquerdo da Equação (1.139) se reduz a bı (x, y, z), em concordância com a Equação (1.135a). 
Com f> e f3 dadas pela Equação (1.140), podemos construir A: 


x y ax 
A = z ba(x, y, 2) dx + 2 [/ bi(xo,y,2) dy — / bo(x, y, z) de ; (1.141) 
zo Yo zo 

Contudo, isso ainda não está bem completo. Podemos adicionar qualquer constante, já que B é uma derivada de 
A. O mais importante é que podemos adicionar qualquer gradiente de uma função escalar V y sem afetar B em 
nada. Por fim, as funções fz e f3 não são únicas. Outras escolhas poderiam ter sido feitas. Em vez de estabelecer 
ay = O para obter a Equação (1.136), qualquer permutação cíclica 1, 2, 3, £, Y, Z, £o, Yo, Zo também funcionaria. 


2É claro que isso pode ser feito em qualquer ponto. Mas não é nada óbvio que essa pressuposição seja válida para todos os pontos; isto é, 
que A será bidimensional. A justificativa para essa pressuposição é que ela funciona; a Equação (1.141) satisfaz a Equação (1.134). 
25 A fórmula de Leibniz no Exercício 9.6.13 é útil aqui. 
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Exemplo 1.13.3 UM POTENCIAL VETORIAL MAGNÉTICO PARA UM CAMPO MAGNÉTICO CONSTANTE 


Para ilustrar a construção de um potencial vetor magnético, tomamos o caso especial, se bem que importante, de 
uma indução magnética constante 


B = ĉB,, (1.142) 

na qual B, é uma constante. As Equações (1.135a a c) se tornam 

das das = 

Oy gz 

da das 

Re DR ne, 1.14 

Oz dx 0, Cura 

dai oro 

dr Oy 7 


Se admitirmos que aı = 0, como antes, então, pela Equação (1.141), 


A=p f dpi. (1.144) 


tomando uma constante de integração igual a zero. Pode-se verificar com facilidade que esse A satisfaz a 
Equação (1.134). 

Para mostrar que a escolha a, = 0 não era sagrada ou ao menos não era exigida, vamos tentar estabelecer 
a3 = 0. Pela Equação (1.143), 


Dos a (1.145a) 
oz 
SAREN (1.145b) 
oz 
das da 
| DD =B. 1.145 
dx dy ( 9 
Vemos que a; e az são independentes de z ou 
a = a(z, y), as = a2(x,y). (1.146) 
A Equação (1.145c) é satisfeita se tomarmos 
as = pf B, dz = px B; (1.147) 
e 
y 
a = w-1) f B, dy = (p — 1)yB+, (1.148) 
sendo p qualquer constante. Então, 
A = (p — 1)yB, + pz Bz. (1.149) 


Novamente, verifica-se que as Equações (1.134), (1.142) e (1.149) são consistentes. A comparação das 
Equações (1.144) e (1.149) mostra imediatamente que A não é único. A diferença entre as Equações (1.144) e 


(1.149) e o aparecimento do parâmetro p na Equação (1.149) pode ser justificada reescrevendo a Equação (1.149) 
como 


Be on Pine a: 
A = —- (y — ŷx)B, + (o- z) (2y + ĵx)B: 


1 1 
= -3 (y — ŷr) B: + (»- JAg (1.150) 
com 
p = zy. (1.151) 
E 
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O primeiro termo em A então corresponde à forma usual 
1 
A = zB xr), (1.152) 


para B, uma constante. 
Adicionar um gradiente de uma função escalar, digamos A ao potencial vetor A não afeta B, pela 
Equação (1.82); isso é conhecido como transformação de calibre (veja os Exercícios 1.13.9 e 4.6.4): 


A>A'S=A+HVA. (1.153) 


Suponha agora que a função de onda Yg resolva a equação de Schrödinger da mecânica quântica sem campo de 
indução magnética B, 


1 
{2 inv)? +V- Eh -0, (1.154) 
que descreve uma partícula de massa m e carga e. Quando B é ligado, a equação de onda se torna 
1 - 2 
—(—iħV — eA) +V- Epy=0. (1.155) 
2m 


Sua solução 1) adquire um fator de fase que depende das coordenadas em geral, 


e apl faw . ar'l ole); (1.156) 


Pela relação 
(—ihV — eA)y = exp [ fa i ar’ finv — eA)ibo — imta} 
Da É Ja ar’ (=ihV Yo), (1.157) 


é óbvio que y% resolve a Equação (1.153) se 1), resolver a Equação (1.154). A derivada covariante de calibre 
V — i(e/h)A descreve o acoplamento de uma partícula carregada com o campo magnético. Costuma ser 
denominada substituição mínima e tem um papel central no eletromagnetismo quântico, a primeira e mais simples 
teoria de calibre na física. 

Resumindo essa discussão do potencial vetor: quando um vetor B é solenoidal, existe um potencial vetor A, 
tal que B = V x A. A é indeterminado a menos de um gradiente aditivo, o que corresponde ao zero arbitrário 
de um potencial, uma constante de integração para o potencial escalar. 

Em muitos problemas o potencial vetor magnético A será obtido pela distribuição de corrente que produz a 
indução magnética B, o que significa resolver a equação (vetor) de Poisson (veja o Exercício 1.14.4). 


Exercícios 
1.13.1 Se uma força F é dada por 


F = (x? +y? + 2) (Rr ŷy + ĉz), 


ache: 
(a) V-F. 
b) VxF. 
(c) Um potencial escalar y(x, y, z) tal que F = -V yọ. 
(d) Para qual valor do expoente n o potencial escalar diverge na origem e também no infinito? 
Resposta: (a) (2n + 3)r?”, (b) 0, 
(c) Sy a n Æ —1, (d) n = 1, 
p=-—lInr. 


60 
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1.13.2 


1.13.3 


1.13.4 


1.13.5 


1.13.6 


1.13.7 


Uma esfera de raio a é uniformemente carregada (por todo o seu volume). Construa o potencial 
eletrostático y(r) para O < r < oo. 

Sugestão: Na Seção 1.14 mostra-se que a força de Coulomb sobre uma carga de teste em r = ro 
depende somente da carga para distâncias menores do que ro e é independente da carga para 
distâncias maiores que ro. Note que isso se aplica a uma distribuição de carga esfericamente 
simétrica. 

O problema usual da mecânica clássica é calcular o movimento de uma partícula dado o potencial. 
Para uma esfera maciça não-rotativa com densidade uniforme (pọ), a lei de Gauss da Seção 1.14 
leva a uma força gravitacional sobre uma massa unitária mo no ponto ro produzida pela atração da 
massa em r < ro. A massa em r > rọ nada contribui para a força. 


(a) Mostre que F/mo = —(4rGpo/3)r, O < r < a, em que a é o raio da esfera. 
(b) Ache o potencial gravitacional correspondente, 0 < r < a. 
(c) Imagine um orifício vertical atravessando completamente o centro da Terra até o lado oposto. 


Desprezando a rotação da Terra e admitindo uma densidade uniforme pọ = 5,5 gm/cmê, 
calcule a natureza do movimento de uma partícula que cai dentro do orifício. Qual é seu 
período? 


Nota: Na verdade, F x r é uma aproximação muito ruim. Por causa da densidade variável, a 
aproximação F = constante ao longo da metade exterior de uma linha radial e F x r ao longo 
da metade interior é uma aproximação muito mais exata. 


A origem das coordenadas cartesianas está no centro da Terra. A Lua está sobre o eixo z, a uma 
distância fixa R (distância centro a centro). A força de maré exercida pela Lua sobre uma partícula 
na superfície da Terra (ponto x,y, z) é dada por 

Ë 


R3’ 


zZ 


F; = —GMm Fº 


y 
Fy =-GMm73> F, = +2GMm 


Ache o potencial gerado por essa força de maré. 
>. GMm/ 4» Lo 1, 
Resposta: E (: 3º 34 ; 
Em termos dos polinômios de Legendre do 
Capítulo 12 essa expressão se torna 


GMm 
E 3 


r2 Po(cos 0). 


Um fio longo e reto que transporta uma corrente I produz uma indução magnética B com 


componentes 
p = tal Sie eN, 
2m \ z? +y? r? +y? 


Ache um potencial vetor magnético A. 


Resposta: A = —ĉ2( u1 /4r) ln(x? + y?). (Essa solução não é única). 


î £ z 
Bs 5 , 
r r'r’ r 


ache um vetor A tal que V x A = B. Uma solução possível é 


Se 


gyz rz 


A= 
r(z? +y?) (a? +y?) 


Mostre que o par de equações 
1 
A=ņ35(Bxr), B=VxA 


é satisfeito por qualquer indução magnética constante B. 
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1.13.8 O vetor B é formado pelo produto de dois gradientes 
B = (Vu) x (Vv), 


em que u e v são funções escalares. 
(a) Mostre que B é solenoidal. 
(b) Mostre que 


1 
A= z Yv- v Vu) 
é um potencial vetor para B, considerando que 
B=VxA. 


1.13.9 A indução magnética B está relacionada ao potencial vetor magnético potential A por 
B = V x A. Pelo teorema de Stokes 


[B do= f A-a. 


Mostre que cada lado dessa equação é invariante sob a transformação de calibre, A —> A + Vo. 
Nota: Considere a função y uma função de valor único. A transformação de calibre completa é 
considerada no Exercício 4.6.4. 

1.13.10 Sendo E o campo elétrico e A o potencial vetor magnético, mostre que [E + dA /ðt] é irrotacional 
e que, portanto, podemos escrever 

A 

ot 


1.13.11 A força total sobre uma carga q movimentando-se com velocidade v é 


E=-Vy-— 


F-qE-+vxB). 
Usando os potenciais escalar e vetorial, mostre que 


dA 


Note que agora temos uma derivada total de tempo de A em lugar da derivada parcial do Exercício 
1.13.10. 


1.14 Lei de Gauss, Equação de Poisson 


Lei de Gauss 

Considere uma carga elétrica pontual q na origem de nosso sistema coordenado. Isso produz um campo elétrico E 
dado por? é 
qî 

— 4reor? ` 


(1.158) 


Agora derivamos a lei de Gauss, que afirma que a integral de superfície na Figura 1.35 é q/£o se a superfície 
fechada S = ØV incluir a origem (onde q está localizada) e zero se a superfície não incluir a origem. A superfície 
S é qualquer superfície fechada; não precisa ser esférica. 


Usando o teorema de Gauss, Equações (1.101a) e (1.101b) (e desprezando q/47c0), obtemos 


cd ; 
1 =| V. (=) dr =0, (1.159) 
V 


pelo Exemplo 1.7.2, contanto que a superfície S não inclua a origem, onde os integrandos não são definidos. Isso 
prova a segunda parte da lei de Gauss. 

A primeira parte, na qual a superfície S deve incluir a origem, pode ser resolvida cercando a origem com uma 
pequena esfera S” = V” de raio ô (Figura 1.36). Para não haver dúvida alguma sobre o que está dentro e o que está 


260 campo elétrico E é definido como a força por carga unitária sobre uma pequena carga estacionária de teste q; E = F/qr. Pela lei de 
Coulomb, a força sobre q: devida a q é F = (qq: /47c0)(£/r2). Quando dividimos por qt, obtemos a Equação (1.158). 
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S º, 
| E-do=0 
s 
S 
q 
| Edo- L 

E 


Figura 1.35: Lei de Gauss. 


fora, imagine o volume fora da superfície externa S e o volume dentro da superfície S'(r < 5) conectados por um 
pequeno orifício. Isso une as superfícies S e 5”, combinando-as em uma única superfície fechada simplesmente 
conexa. Como podemos considerar o raio do orifício imaginário tão pequeno a ponto de desaparecer, não há 
nenhuma contribuição adicional à integral de superfície. A superfície interna é escolhida deliberadamente como 
esférica, portanto poderemos integrá-la. Agora o teorema de Gauss se aplica ao volume entre S e S” sem nenhuma 


dificuldade. Temos d è. do! 
f- do f- do 

=0. 1.160 

! r? + RE: ici 
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m> 


x 
Figura 1.36: Exclusão da origem. 
Podemos avaliar a segunda integral, para do” = —£6? dQ, na qual dì é um elemento do ângulo sólido. O sinal de 
menos aparece porque concordamos, na Seção 1.10, que a normal positiva f’ aponta para fora do volume. Nesse 
caso, ĉ que aponta para fora está na direção radial negativa, ?” = —f. Integrando sobre todos os ângulos, temos 
?- do! P 29? dO 
E re L P 4T, (1.161) 
independente do raio ô. Com as constantes da Equação (1.158), isso resulta em 
fE- d= EES (1.162) 
S 47€e0 E0 


concluindo a prova da lei de Gauss. Note que, embora a superfície .S possa ser esférica, ela não precisa ser esférica. 
Avançando um pouco mais, consideramos uma carga distribuída de modo que 


a= [ pdr. (1.163) 
V 


A Equação (1.162) ainda se aplica, agora interpretando q como a carga total distribuída encerrada pela superfície 


[Edo = | £ dr (1.164) 
S v E0 
Usando o teorema de Gauss, temos 
|x enf L dr. (1.165) 
V v E0 
Uma vez que nosso volume é completamente arbitrário, as integrandas devem ser iguais ou 
—_ P 
V.E=-, (1.166) 
E0 


uma das equações de Maxwell. Se invertermos o argumento, a lei de Gauss resulta imediatamente da equação de 
Maxwell. 


Equação de Poisson 
Se substituirmos E por — V ọ, a Equação (1.166) se torna 


Vitae, (1.167a) 


E0 
que é a equação de Poisson. Para a condição p = 0 essa expressão se reduz a uma equação ainda mais famosa, 


V-Vy=0, (1.167b) 
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a equação de Laplace. Encontramos fregientemente a equação de Laplace na discussão de vários sistemas 
coordenados (Capítulo 2) e de funções especiais da física matemática que aparecem como suas soluções. A equação 
de Poisson será de inestimável valor no desenvolvimento da teoria das funções de Green (Seção 9.7). 
Por comparação direta entre a lei da força eletrostática de Coulomb e a lei da gravitação universal de Newton, 
1 aga, Mama . 


f, Fe = -G—; +. 


Fg = = 
4TEo 7? r 


Toda a teoria de potenciais desta seção se aplica igualmente bem a potenciais gravitacionais. Por exemplo, a 
equação gravitacional de Poisson é 
V -Vp = +4rGp, (1.168) 


sendo p agora uma densidade de massa. 


Exercícios 
1.14.1 Desenvolva a lei de Gauss para o caso bidimensional em que 
In p Ê 
4 É 21€0' Ee 27E09p 


Aqui, q é a carga na origem ou a carga da linha por comprimento unitário se o sistema bidimensional 
for uma fatia de espessura unitária de um sistema (cilíndrico circular) tridimensional. A variável p 
é medida radialmente para fora a partir da linha de carga p é o vetor unitário correspondente (veja 
a Seção 2.4). 


1.14.2 (a) Mostre que a lei de Gauss resulta da equação de Maxwell 


v.E=2. 
E0 
Aqui, p é a densidade de carga usual. 

(b) Admitindo que o campo elétrico de uma carga pontual q é esfericamente simétrico, mostre 
que a lei de Gauss implica a expressão de Coulomb inversamente proporcional ao quadrado da 
distância. E 

op dd 
— 4regr? ` 


1.14.3 Mostre que o valor do potencial eletrostático y em qualquer ponto P é igual à média do potencial 
sobre qualquer superfície esférica centrada em P. Não há cargas elétricas sobre a esfera ou dentro 
dela. 

Sugestão: Use o teorema de Green, Equação (1.104), com u” 
v = yọ. Note também a Equação (1.170) na Seção 1.15. 


1 = r, a distância a partir de P, e 


1.14.4 Usando as equações de Maxwell, mostre que, para um sistema (corrente estacionária) o potencial 
vetor magnético A satisfaz uma equação vetorial de Poisson 


VºA = —uod, 
contanto que imponhamos V - A = 0. 


1.15 Função Delta de Dirac 


Pelo Exemplo 1.6.1 e pelo desenvolvimento da lei de Gauss na Seção 1.14, 


fov()a=- [o ()a=| is (1.169) 
r r 0, 


dependendo de a integração incluir ou não a origem r = 0. Esse resultado pode ser expresso convenientemente 
introduzindo a função delta de Dirac, 


v(+)= 4rô(r) = —4rô(x)ô(y)ó(z). (1.170) 
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Essa função delta de Dirac é definida por suas propriedades atribuídas 


d(x) = 0, 20 (1.171a) 


f(0) = e F(a)ó(a) de, (1.171b) 


em que f(x) é qualquer função bem-comportada e a integração inclui a origem. Como um caso especial da 
Equação (1.171b), 


d(a) da = 1. (1.171c) 

Pela Equação (1.171b), ó(x) deve ser um pico infinitamente alto, infinitamente estreito em x = 0, como na 

descrição de uma força impulsiva (Seção 15.9) ou a densidade de carga para uma carga pontual.?” O problema é 

que não existe tal função, no sentido usual de função. Todavia, a propriedade crucial na Equação (1.171b) pode 

ser desenvolvida rigorosamente como o limite de uma segiiência de funções, uma distribuição. Por exemplo, a 
função delta pode ser aproximada pela segiiência de funções, Equações (1.172) a (1.175) e Figuras 1.37 a 1.40: 


y=0,() 


0, £< 5 
ônlu)=4 n, = <r< 5 (1.172) 
0, pa 5 
n 
nl) = exp(—n2x?) (1.173) 
vz 
n 1 
ô = 1.174 
na) m 1+n?r? ( ) 
A é 
ôn(x) = ——— => | dt. (1.175) 


27 A função delta é freqüentemente invocada para descrever forças de alcance muito curto, como forças nucleares. Ela também aparece na 
normalização de funções de ondas contínuas da mecânica quântica. Compare a Equação (1.193c) para funções de ondas planas. 
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Figura 1.38: Função segiiência ô. 


Figura 1.39: Função segiiência ô. 
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> X 


Figura 1.40: Função segiiência ô. 


Essas aproximações têm graus variados de utilidade. A Equação (1.172) é útil para prover uma derivação simples da 
propriedade de integral, Equação (1.171b). A Equação (1.173) é conveniente para diferenciar. Suas derivadas levam 
aos polinômios de Hermite. A Equação (1.175) é particularmente útil na análise de Fourier e em suas aplicações 
na mecânica quântica. Na teoria da série de Fourier, a Equação (1.175) muitas vezes aparece (modificada) como o 
“Kernel”de Dirichlet: i 
pao 1 sen[(n + 5) 2] 


= 1.176 
27  sen(ja) ( ) 


Ao usar essas aproximações na Equação (1.171b) e mais adiante, admitimos que f(x) é bem comportada — não 
oferece problemas quando zx é grande. 
Para a maioria dos propósitos físicos, essas aproximações são bastante adequadas. De um ponto de vista 
matemático, a situação ainda é insatisfatória: os limites 
lim ôn(a) 
n—00 
não existem. 
Uma saída para essa dificuldade é dada pela teoria das distribuições. Reconhecendo que a Equação (1.171b) 
é a propriedade fundamental, focalizamos nossa atenção nela, em vez de em ô(x) em si. As Equações (1.172) a 
(1.175) com n = 1,2,3,... podem ser interpretadas como seqiiências de funções normalizadas: 


A segiiência de integrais tem o limite 


de ôn(2) dz = 1. (1.177) 


lim n(x) f(x) de = f(0). (1.178) 


n—00 


Note que a Equação (1.178) é o limite de uma segiiência de integrais. Novamente, o limite de n(x), com 
n — oo, não existe. (Os limites para todas as quatro formas de ôn (x) divergem em z = 0.) 
Podemos tratar ô(x) consistentemente na forma 


J (x) f(x) da = dim ôn(a) f(x) de. (1.179) 
ô(x) é denominada distribuição (não uma função) definida pelas segiências ô,(x), como indicado na 
Equação (1.179). Poderíamos enfatizar que a integral do lado esquerdo da Equação (1.179) não é uma integral 
de Riemann: É um limite. 

Essa distribuição (x) é somente uma dentre a infinidade de distribuições possíveis, mas é a distribuição em que 
estamos interessados por causa da Equação (1.171b). 

Por essas sequências de funções, vemos que a função delta de Dirac deve ser par em x, d(—x) = d(a). 

A propriedade da integral, Equação (1.171b), é útil em casos em que o argumento da função delta é uma função 


28Ela pode ser tratada como uma integral de Stieltjes, se desejado. (2) dx é substituída por du(x), em que u(x) é a função degrau de 
Heaviside (compare com o Exercício 1.15.13). 
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g(x) com zeros simples nos eixos reais, o que leva às regras 


d(ax) = Tafa), a >00, (1.180) 
A 
slg) = > aa (1.181a) 
g(a)=0, 
g'(a) £0 


A Equação (1.180) pode ser escrita como 


I F(x)ô(ax) dz = TRALO E “1(0), 


+. 
g 


aplicando a Equação (1.171b). A Equação (1.180) pode ser escrita como ó(ax) = 
a Equação (1.181a) decompomos a integral 


ô(x) para a < 0. Para provar 


oo a-+e 
f Ha)ó(g(x)) da = e e Ha)ó((a — a)g'(a)) dz (1.181b) 


em uma soma de integrais sobre pequenos intervalos contendo os zeros de g(x). Nesses intervalos, g(x) = 
gla) + (x — a)g'(a) = (x — a)g' (a). Usando a Equação (1.180) do lado direito da Equação (1.181b), obtemos a 
integral da Equação (1.181a). 

Usando integração por partes, também podemos definir a derivada ô'(x) da função delta de Dirac pela relação 


T f(x) (x — x) dz = -f F(a)ó(a — a) dx = — f(x”). (1.182) 


Usamos ô(x) frequentemente e a denominamos função delta de Dirac? — por razões históricas. Lembre-se de 
que ela, na verdade, não é uma função. É, em essência, uma notação abreviada, definida implicitamente como o 
limite de integrais em uma segiiência, ôn (x), conforme a Equação (1.179). Deve ficar entendido que nossa função 
delta de Dirac tem significado apenas como parte de um integrando. Nesse espírito, o operador linear f da ó(a—xo) 
opera sobre f(x) e resulta f (xo): 


L(zo) f(x) = D lx — xo) f(x)dx = f(xo). (1.183) 


Ela também pode ser classificada como um mapeamento linear ou simplesmente como uma função generalizada. 
Transferindo nossa singularidade para o ponto x = «”, escrevemos a função delta de Dirac como (x — x). A 
Equação (1.171b) se torna 


a Ha)ó(a — x’) da = f(x’). (1.184) 


Como descrição de uma singularidade em x = «”, a função delta de Dirac pode ser escrita como ó(x — x”) ou 
como ó(x” — x). Partindo para três dimensões e usando coordenadas esféricas polares, obtemos 


27 pm poo o0 
J T / ó(r)r2 drsen 0 do dy = I ô(x)ôly)ð(z) dx dy dz = 1. (1.185) 
o Jo Jo —o0 


Essa expressão corresponde a uma singularidade (ou fonte) na origem. Novamente, se nossa fonte estiver em 
r = rı, a Equação (1.185) se torna 


I ô(r2 — r1)rá drasen 02 dbz dy, = 1. (1.186) 


2 Dirac introduziu a função delta na mecânica quântica. Na verdade, a função delta pode ser rastreada até Kirchhoff, 1882. Se quiser mais 
detalhes, consulte M. Jammer, The Conceptual Development of Quantum Mechanics. Nova York: McGraw-Hill (1966), p. 301. 
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Exemplo 1.15.1 CARGA TOTAL DENTRO DE UMA ESFERA 


Considere o fluxo elétrico total $ E- do que sai de uma esfera de raio R ao redor da origem e que circunda n cargas 
ej, localizadas nos pontos r; com r; < R, isto é, dentro da esfera. A força do campo elétrico E = -V y(r), em 


que o potencial 
n 
pedia =" e 


é a soma dos potenciais de Coulomb gerados por cada carga e a densidade de carga total é p(r) = > ,e;ó(r —r;). 
A função delta é usada aqui como uma abreviatura de uma densidade semelhante à pontual. Agora, usamos o 
teorema de Gauss para 


fE-do=- f vo-do=- [ipa [Ear = das 
EQ EQ 


em conjunção com a forma diferencial da lei de Gauss, V - E = —p/£ọ, e 


Do fote-r)ár-5Do; 


j 


Exemplo 1.15.2 ESPAÇO DE FASE 


Na teoria da dispersão de partículas relativistas usando diagramas de Feynman, encontramos a seguinte integral 
sobre a energia da partícula dispersa (consideramos a velocidade da luz c = 1): 


fatos? - m’) fp) = feto fa (pg — p? — m?) f(p) 
a| dpf(E,p) | d'p f(E, p) 
E>0 2/m?2 + p? E<0 2M + p? 
em que usamos a Equação (1.181a) nos zeros E = +,/m? + p? do argumento da função delta. O significado 


físico de ó(p? — e é que a partícula de massa m e quadrimento p” = (po, p) está sobre sua camada de massa, 
porque p? = m? é equivalente a E = +/m? T r . Então, o elemento de volume sobre a camada de massa no 


espaço dos momentos é o invariante de Lorentz 2 SP em contraste com o elemento não-relativista d3 p do espaço de 
momento. O fato de ocorrer uma energia negativa é uma peculiaridade da cinemática relativista que é relacionada 
à antipartícula. E 


Representação da Função Delta por Funções Ortogonais 
A função delta de Dirac”? pode ser expandida em termos de qualquer base de funções ortogonais reais {p (£), n = 
0, 1,2, ...}. Essas funções aparecerão no Capítulo 10 como soluções de equações diferenciais ordinárias da forma 
Sturm-Liouville. 

Elas satisfazem as relações de ortogonalidade 


b 
f PmlL)Pn(x) dE = mn, (1.187) 


em que o intervalo (a, b) pode ser infinito em qualquer extremidade ou em ambas. [Por conveniência, admitimos 
que 7, foi definido de modo a incluir (w(£))"/ 2se as relações de ortogonalidade contiverem uma função de peso 
positiva adicional w(x).] Usamos o conjunto de o, para expandir a função delta como 


o(a — t) = Dont Prlz (1.188) 


30Esta seção é opcional aqui. Não será necessária até o Capítulo 10. 
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em que os coeficientes a, são funções da variável t. Multiplicando por Y, (x) e integrando sobre o intervalo de 
ortogonalidade (Equação (1.187)), temos 


b 
an(t)= f ale- mla) de = pml) (1.189) 
S(x — t) = X pn (t)pn (2) = ôlt — 2). (1.190) 
n=0 


Essa série é, com certeza, não-uniformemente convergente (veja o Capítulo 5), mas pode ser usada como parte de 
um integrando no qual a integração resultante a tornará convergente (compare com a Seção 5.5). 

Suponha que formemos a integral f F(t)ó(t — x) dz, em que admitimos que F(t) pode ser expandida em uma 
série de funções ortogonais Po(t), uma propriedade denominada completude. Então, obtemos 


1 F(gó(t— x) dt = / V appplt) SO enlr)en(t) dt 
p=0 n=0 
= X apla) = F(x), (1.191) 
p=0 


e os produtos cruzados f PpPn dt (n Æ p) desaparecem por ortogonalidade (Equação (1.187)). Referindo-nos à 
definição da função delta de Dirac, Equação (1.171b), vemos que nossa representação da série, Equação (1.190), 
satisfaz a propriedade definidora da função delta de Dirac e, portanto, é uma representação dela. Essa representação 
da função delta de Dirac é denominada fechamento. A admissão de completude de um conjunto de funções para 
expansão de ô(x — t) dá a relação de fechamento. O inverso, ou seja, fechamento implica completude, é o tópico 
do Exercício 1.15.16. 


Representações Integrais para a Função Delta 
Transformadas integrais, tais como a integral de Fourier 


F(w) = a f(t) exp(iwt) dt 


do Capítulo 15, levam a representações integrais correspondentes da função delta de Dirac. Por exemplo, tome 


“ senn(t-x) 1 f” gd 
nlt- x)= o lo exp(iw(t — x)) dw, (1.192) 
usando a Equação (1.175). Temos 
f(a) = lim I(Donlt— x) dt, (1.193a) 


em que ôn (t— x) é a segiiência na Equação (1.192), que define a distribuição d(t — x). Note que a Equação (1.193a) 
admite que f(t) é contínua em t = «x. Se substituirmos a Equação (1.192) na Equação (1.193a), obtemos 


f(x) = lim a L f(t) n exp(iw(t — «)) dw dt. (1.193b) 


— 00 =n 


Permutando a ordem de integração e então tomando o limite, à medida que n — oo, temos o teorema da integral 
de Fourier, Equação (15.20). 
Entendendo que está certo apresentá-la sob um sinal de integral como na Equação (1.193a), a identificação 


d(t— x) = E a exp(iw(t — x)) dw (1.193c) 


27 J-o 


provê uma representação integral muito útil da função delta. Quando a transformada de Laplace (veja as 
Seções 15.1 e 15.9) 


Ls(s) = T exp(—st)ô(t — to) = exp(—sto), to>0 (1.194) 
0 
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é invertida, obtemos a representação complexa 


1 y-+ioo 
d(t— to) = =) exp(s(t — to)) ds, (1.195) 
Y 


—ioo 


que é essencialmente equivalente à representação prévia da função delta de Dirac. 


Exercícios 
1.15.1 Seja 
0, T< + ; 
nlr) = 4 n, -4 <<, 
0, + <T 
Mostre que 
lim Ha)ôn(x) de = f(0), 


admitindo que f(x) é contínua em x = 0. 


1.15.2 | Verifique que a segiiência ôn (x), baseada na função 


“Jo, x <0, 
ôn(x) = i ne "E, x >0, 


é uma seqüência delta (que satisfaz a Equação (1.178)). Note que a singularidade está em +0, o 
lado positivo da origem. 

Sugestão: Substitua o limite superior (00) por c/n, em que c é grande mas finito, e use o teorema 
do valor médio do cálculo integral. 


1.15.3 Para 


(Equação (1.174)), mostre que 
/ ôn(x) de = 1. 


1.15.4  Demonstre que ôn = sen nx/ra é uma distribuição delta, mostrando que 


sen nx 


lim E fla) — da = f(0). 


n>0 | o NL 


Admita que f(x) é contínua em x = 0 e se anula quando xz — +oo. 
Sugestão: Substitua x por y/n e considere lim n — œ antes de integrar. 


1.15.5 | O método de Fejer para somar séries é associado com a função 


1 [e OR 


— 2mn| sen (t/2) 


ôn(t) 


Mostre que ô, (t) é uma distribuição delta, no sentido de que 


lim =. rofe] a= 100 


1.15.6 Prove que 
1 
ôļa(z — xı)| = MaG — zı). 


Nota: Se [a(x — x1)] for considerada par em relação a xı, a relação vale para a negativo se 1/a 
pode ser substituído por 1/|a]. 


1.15.7 Mostre que 
ô|(x — x1)(x — x2)] = [0(x — 21) + ôx — x5)] /|£1 — zəl. 


Sugestão: Procure usar o Exercício 1.15.6. 
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1.15.8 Usando a segiiência delta da curva de erro de Gauss (ôn = ar era, mostre que 


d 
Tag 2) = —ó(a), 


tratando (x) e sua derivada como na Equação (1.179). 
1.15.9 Mostre que 


EOLO 


Aqui, admitimos que f'(x) é contínua em z = 0. 
1.15.10 Prove que 


em que x, é escolhido de modo que f (zo) = 0. 
Sugestão: Note que ô( f) df = (x) dz. 
1.15.11 Mostre que em coordenadas esféricas polares, (r, cos 0, p), a função delta ô(rı — rs) se torna 


1 
zir — r2)ô(cos 04 — cos 02) (p1 — Yə). 
1 


Generalize isso para as coordenadas curvilíneas (q1, q2, q3) da Seção 2.1 com fatores de escala hı, 
ha e hs. 


1.15.12 Um desenvolvimento rigoroso de transformadas de Fourier’! inclui, como um teorema as relações 


lim — F(u+ x) dx 
a>oo T a 
Flu + 0) + f(u — 0), vi <0 < T2 
= FC + 0), £ı =0 < T2 
FC — 0), zı <0= 2 
0, £1 < £2 < Q orQ0 < z1 < T2. 


Verifique esses resultados usando a função delta de Dirac. 


1.15.13 (a) Se definirmos uma seqüência ô, (x) = n/(2 cosh? nz), mostre que 
/ n(x) da = 1, independente de n. 
(b) Continuando essa análise, mostre que?? 


P n(x) de = 5h + tanh nx] = un (£), 


; 0, z <0, 
dm wto) = d 1 t> 0. 


Esta é a função degrau unitário de Heaviside (Figura 1.41). 


1.15.14 Mostre que uma função degrau unitário u(x) pode ser representada por 


em que P significa o valor principal de Cauchy (Seção 7.1). 


31LN. Sneddon, Fourier Transforms. Nova York: McGraw-Hill (1951). 
32Muitos outros símbolos são usados para essa função. Essa é a notação AMS-55 (veja a nota de rodapé 4 no Capítulo 5 como referência): 
u para unidade. 
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1.15.15 


1.15.16 


1.15.17 


1.15.18 


1.15.19 


n grande 


u) n> o 


n pequeno 


Figura 1.41: all + tanh nz] e a função degrau unitário de Heaviside. 


Como variação da Equação (1.175), considere 


1 RSN 
inla) = — / ist Ito dt, 


Mostre que essa expressão se reduz a (n/m)1/(1 + n2x2), Equação (1.174), e que 


/ ôn(x) dae = 1. 


Nota: Em termos de transformadas integrais, a equação inicial aqui pode ser interpretada como uma 
transformada exponencial de Fourier de e—!tl/" ou como uma transformada de Laplace de e'”*. 


(a) A representação da função delta de Dirac dada pela Equação (1.190), 


n=0 


é fregiientemente denominada relação de fechamento. Para um conjunto ortonormal de 
funções reais, (7, , mostre que fechamento implica completude, isto é, a Equação (1.191) resulta 
da Equação (1.190). 

Sugestão: Podemos considerar 


F(x) = / FH Slx — t) dt. 


(b) Seguindo a sugestão da parte (a), você encontra a integral f F (t)p„(t) dt. Como você sabe que 
essa integral é finita? 


Para o intervalo finito (—7, m) escreva a função delta de Dirac (x — t) como uma série de senos 

e co-senos: sen nx, cosnx,n = 0,1,2,... Note que, embora essas funções sejam ortogonais, elas 

não são normalizadas à unidade. 

n 

VT 

(a) Escreva ôn (1) como uma série de Fourier de co-senos. 

(b) Mostre que sua série de Fourier está de acordo com uma expansão de Fourier de ô(x) no limite 
quando n — œ. 

(c) Confirme a natureza de função delta de sua série de Fourier mostrando que, para qualquer f(x) 
que seja finito no intervalo [—7, 7] e contínuo em z = 0, 


No intervalo (—7, 7), ôn(x) = += exp(—n2x?). 


g f(x) [expansão de Fourier de ô% (x)] dz = f (0). 


(a) Escreva ôn(x) = J exp(—n2x2) no intervalo (—00, 00) como uma integral de Fourier e 


compare o limite n — oco com a Equação (1.193c). 

(b) Escreva ôn(x:) = nexp(—nax) como uma transformada de Laplace e compare o limite n — oo 
com a Equação (1.195). 

Sugestão: Veja as Equações (15.22) e (15.23) para (a) e a Equação (15.212) para (b). 
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1.15.20 (a) Mostre que a função delta de Dirac ô(x — a), expandida em uma série de Fourier de senos no 
meio-intervalo (0, L), (0 < a < L), é dada por 


2 oo 
ô(xz — a) = L 2 (25º )sen E) 
Note que, na verdade, essa série descreve 

—ó(x +a) + ô(z— a) no intervalo (—L, L). 


(b) Integrando ambos os lados da equação precedente de 0 a x, mostre que a expansão do co-seno 


da onda quadrada 
0, O0O<zr<a 
rw- i a<rx<L, 


é, para 0 < x < L, 


2Y Laen ( 228) é (f(z) = Ef tejas 


1.15.21 Verifique a expansão de Fourier de co-seno da onda quadrada, Exercício 1.15.20(b), por cálculo 
direto dos coeficientes de Fourier. 


1.15.22 Podemos definir uma seqüência 


ofn, |x| < 1/2n, 
Sula) = ( 0, |z| >1/2n. 


(Essa é a Equação (1.172).) Expresse ôn (x) como uma integral de Fourier (via o teorema da integral 
de Fourier, transformada inversa etc.). Por fim, mostre que podemos escrever 


lx) = lim ôn(x) : / e dk. 


n= Z 27 


1.15.23 Usando a segiiência 


mostre que 


(x) = =| et dk. 
27 Jo 


Nota: Lembre que ô(x) é definida em termos de seu comportamento como parte de um 
integrando — em especial as Equações (1.178) e (1.189). 


1.15.24 Derive representações de seno e co-seno de (t — x) que são comparáveis com a representação 
exponencial, Equação (1.193c). 
2 


x E 2 [89 4 g 
Resposta: 2 fg sen wtsen wz dw, 4 fọ coswtcoswz dw. 


1.16 Teorema de Helmholtz 


Na Seção 1.13 foi enfatizado que a escolha de um potencial vetor magnético A não era única. A divergência de 
A ainda era indeterminada. Nesta seção são desenvolvidos dois teoremas sobre a divergência e o rotacional de um 
vetor. O primeiro teorema tem o seguinte enunciado: 

Um vetor é unicamente especificado dando sua divergência e sua espiral dentro de uma região simplesmente 
conexa (sem orifícios) e seu componente normal sobre a fronteira. 

Note que as sub-regiões, onde a divergência e o rotacional são definidos (muitas vezes em termos de funções 
delta de Dirac), são parte de nossa região e não se espera que sejam removidas aqui ou no teorema de Helmholtz 
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que vem em seguida. Vamos considerar 
vV. Vi — 8, 
(1.196) 
V x Vi =C, 


em que s pode ser interpretada como uma densidade de fonte (carga) e c como uma densidade de circulação 
(corrente). Admitindo também que a componente normal Vin na fronteira é dada, queremos mostrar que V; é 
único. Fazemos isso admitindo a existência de um segundo vetor, V2, que satisfaz a Equação (1.196) e tem a 
mesma componente normal na fronteira, e então mostrando que Vı — V2 = 0. Seja 


W=-V,— Vo. 
Então 
V.W=-0 (1.197) 
e 
VxW-o. (1.198) 


Visto que W é irrotacional, podemos escrever (pela Seção (1.13)) 

W = -Vọ. (1.199) 
Substituindo essa expressão na Equação (1.197), obtemos 

V-V =0, (1.200) 


a equação de Laplace. 
Agora nos utilizamos do teorema de Green na forma dada na Equação (1.105), com u e v cada um igual a ọ. 
Visto que 


na fronteira, o teorema de Green se reduz a 
i (Vo): (Vo) ar= f W.Wdr=0. (1.202) 
V V 


A quantidade W - W = W? é não-negativa, e portanto devemos ter 
W=Vi-V2=0 (1.203) 


em tudo. Assim, V4 é único, o que prova o teorema. 

Para nosso potencial vetor magnético A a relação B = V x A especifica o rotacional de A. Muitas vezes, por 
conveniência, estabelecemos V - A = 0 (compare com o Exercício 1.14.4). Então (com condições de fronteira), 
A é fixo. 

Esse teorema pode ser escrito como um teorema de unicidade para soluções da equação de Laplace, 
Exercício 1.16.1. Nessa forma, esse teorema de unicidade é de grande importância para a solução de problemas 
de valores de fronteira eletrostáticos e da equação de Laplace. Se pudermos encontrar uma solução da equação 
de Laplace que satisfaça as condições necessárias de fronteira, então nossa solução é a solução completa. Esses 
problemas de valor de fronteira são discutidos nas Seções 12.3 e 12.5. 


Teorema de Helmholtz 
O segundo teorema que provaremos é o teorema de Helmholtz. 

Um vetor V que satisfaça a Equação (1.196) com ambas as densidades de fonte e de circulação desaparecendo 
no infinito pode ser escrito como a soma de duas partes, uma das quais é irrotacional e a outra solenoidal. 

Note que, por simplicidade, nossa região é simplesmente conexa, sendo toda espaço. O teorema de Helmholtz 
será claramente satisfeito se pudermos escrever V como 


V=-Vy+V xA, (1.204a) 


sendo — V ọ irrotacional e V x A solenoidal. Passamos a justificar a Equação (1.204a). 
V é um vetor conhecido. Consideramos a divergência e o rotacional 


V-V=s(r) (1.204b) 
VxV=c(r) (1.204c) 
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V222) 


Figura 1.42: Pontos de fonte e de campo. 


sendo s(r) e c(r) agora funções conhecidas da posição. Por essas duas funções construímos um potencial escalar 
p(rı), 


1 
plr) = =) de o, (1.205) 
VIR T12 
e um potencial vetor A(r1), 
1 
A(r) = + | Ear, (1.205b) 
47 T12 


Se s = 0, então V é solenoidal e a Equação (1.205a) implica y = 0. Pela Equação (1.204a), V = V x A, 
sendo A como dado na Equação (1.141), que é consistente com a Seção 1.13. Além disso, se c = 0, então V é 
irrotacional e a Equação (1.205b) implica A = 0, e a Equação (1.204a) implica V = -V ọ, consistente com a 
teoria do potencial escalar da Seção 1.13. 

Aqui, o argumento r indica (£1, Y1, z1), O ponto do campo; rs, as coordenadas do ponto da fonte (£2, Y2, 22), 


enquanto 
2 2 271/2 
ro = [(z1 — £2)? + (gn — go)? + (z1 — 22)°] O (1.206) 
Quando uma direção é associada com r12, a direção positiva é considerada afastando-se da fonte e dirigida ao 
pondo de campo. Em termos vetoriais, r/2 = rı — r2, como mostra a Figura 1.42. E claro que s e c devem 
se anular com suficiente rapidez em grandes distâncias para que as integrais existam. A expansão e a avaliação 
propriamente ditas de integrais como as Equações (1.205a) e (1.205b) são tratadas na Seção 12.1. 
Pelo teorema da unicidade no início desta seção, V é unicamente especificado por sua divergência, s, e 
rotacional, c (e condições de fronteira). Voltando à Equação (1.204), temos 


VV=-V.vg, (1.207a) 
a divergência do rotacional que se anula, e 
VxV=Vx(VxaA), (1.207b) 
o rotacional do gradiente que se anula. Se pudermos mostrar que 
-V - Volrı) = s(rı) (1.207c) 
e 
V x (V x A(rı)) =c(r), (1.207d) 


então V, como dado na Equação (1.204a), terá a divergência e o rotacional adequados. Nossa descrição será 
internamente consistente, e a Equação (1.204a) será justificada. 
Primeiro, consideramos a divergência de V: 


1 
V-V =-V: Vps- VV f ar, (1.208) 


33 Alternativamente, poderíamos resolver a Equação (1.207c), equação de Poisson, e comparar a solução com o potencial construído, 
Equação (1.205a). A solução da Equação de Poisson é desenvolvida na Seção 9.7. 
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O operador laplaciano, V - V ou y? opera sobre as coordenadas do campo (x1, y1, 21) e, assim, comuta com a 
integração em relação a (£2, Y2, 22). Temos 


1 1 

V.V= -+ fsan) dra. (1.209) 
47 T12 

Devemos fazer duas pequenas modificações na Equação (1.169) antes de aplicá-la. Primeiro, nossa fonte está em 

T2, e não na origem. Isso significa que um resultado não-zero da lei de Gauss aparece se, e somente se, a superfície 

S incluir o ponto r = rz. Para mostrar isso, reescrevemos a Equação (1.170): 


1 
y? ( ) = —4rô(rı — rə). (1.210) 
T12 
Esse deslocamento da fonte para rə pode ser incorporado à equação de definição (1.171b) como 
ô(rı — r2) = 0, rı Æ T9, (1.211a) 
J reie — ro) dr = f(r2). (1.211b) 


Em segundo lugar, notando que diferenciar riz duas vezes em relação a £2, Y2, Z2 é o mesmo que diferenciar duas 
vezes em relação a x1, y1, 21, temos 


afiy valilo 
vi(=) = vi(=) = 4rå(rı r2) 


= —4rô(r2 — r1). (1.212) 


Reescrevendo a Equação (1.209) e usando a função delta de Dirac, Equação (1.212), podemos integrar para obter 


1 1 
V.V= + [eovi(=) dr» 
47 T12 


1 
= EF / s(r2)(—4r)ð(r2 = rı) dT2 
= s(rı). (1.213) 
A etapa final resulta da Equação (1.211b), com os índices 1 e 2 permutados. Nosso resultado, Equação (1.213), 
mostra que as formas admitidas de V e do potencial escalar y estão de acordo com a divergência dada 
(Equação (1.204b)). 
Para concluir a prova do teorema de Helmholtz, precisamos mostrar que o que admitimos é consistente com a 
Equação (1.204c), isto é, que o rotacional de V é igual a c(r1). Pela Equação (1.204a), 
VxV=Vx(VxA) 
=VV.A-VÊA. (1.214) 


O primeiro termo, VV - A, leva a 
1 
aVV A | elr) vava( +) dT2 (1.215) 
T12 


pela Equação (1.205b). Novamente substituindo as derivadas de segunda ordem em relação a z1, y1, 21 por 
derivadas de segunda ordem em relação a x», y>, 22, integramos cada componente” da Equação (1.215) 
por partes: 


41VV. Al == Joea i v, (=) dr» 


dus ria 


«fe peso) 


o 1 
- five cetro] o (=) Tis (1.216) 


34Tsso evita criar o tensor e(ro) Vo. 


“livro” — 2007/81 — 15:06 — page 78 — #88 


78 Física Matemática Arfken e Weber ELSEVIER 


A segunda integral desaparece porque a densidade de circulação c é solenoidal.’ A primeira integral pode ser 
transformada em uma integral de superfície pelo teorema de Gauss. Se c for limitado no espaço ou se anular mais 
rapidamente do que 1/r para r grande, de modo que a integral na Equação (1.205b) existe, então, escolhendo uma 
superfície suficientemente grande, a primeira integral do lado direito da Equação (1.216) também se anula. 

Com VV. A = 0, a Equação (1.214) agora se reduz a 


1 1 
VxV=-VºA= + | ee»v} (=) dra. (1.217) 


T12 


Isso é exatamente como a Equação (1.209), exceto que o escalar s(r2) é substituído pela densidade de circulação 
vetorial c(r>). Introduzindo a função delta de Dirac, como antes, como um modo conveniente de realizar a 
integração, constatamos que a Equação (1.217) é reduzida à Equação (1.196). Vemos que as formas que admitimos 
para V, dadas pela Equação (1.204a), e para o potencial vetor A, dadas pela Equação (1.205b), estão de acordo 
com a Equação (1.196) que especifica o rotacional de V. 

Isso conclui a prova do teorema de Helmholtz, mostrando que um vetor pode ser resolvido em partes irrotacional 
e solenoidal. Aplicado ao campo eletromagnético, resolvemos nosso campo vetorial V em um campo elétrico 
irrotacional E, derivado de um potencial escalar y, e um campo de indução magnética solenoidal B, derivado de um 
potencial vetor A. A densidade de fonte s(r) pode ser interpretada como uma densidade de carga elétrica (dividida 
pela permissividade £), enquanto a densidade de circulação c(r) se torna densidade de corrente elétrica (vezes a 
permeabilidade magnética u). 


Exercícios 
1.16.1 Implícita nesta seção está uma prova de que uma função y(r) é unicamente especificada exigindo- 
se que (1) satisfaça a equação de Laplace e (2) satisfaça um conjunto completo de condições de 
fronteira. Desenvolva essa prova explicitamente. 


1.16.2 (a) Admitindo que P é uma solução da equação vetorial de Poisson, VZP(r)) = —V(ri), 
desenvolva uma prova alternativa do teorema de Helmholtz, mostrando que V pode ser escrito 
como 


V=-Vọ+ V xA, 
em que 
A=VxP, 
p=V-P. 


(b) Resolvendo a equação vetorial de Poisson, encontramos 


Mostre que esta solução, substituída em y e A da parte (a) leva às expressões dadas para y e A 
na Seção 1.16. 
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35Lembre-se de que c = V x V é conhecido. 


“livro” — 2007/8/1 — 15:06 — page 79 — #89 


1. ANÁLISE VETORIAL 19 


ELSEVIER 


Wrede, R. C., Introduction to Vector and Tensor Analysis. Nova York: Wiley (1963). Nova tiragem, Nova York: 
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Análise Vetorial em Coordenadas Curvas e 
Tensores 


No Capítulo 1 nos restringimos quase completamente a sistemas retangulares ou de coordenadas cartesianas. Um 
sistema de coordenadas cartesianas oferece uma vantagem única: todos os três vetores unitários, X, y e Z, têm 
direção e módulos constantes. Introduzimos a distância radial r, mas até ela foi tratada como uma função de x, y 
e z. Infelizmente, nem todos os problemas físicos se adaptam bem a uma solução em coordenadas cartesianas. Por 
exemplo, no caso de um problema de força central, F = ĉF (r), tal como uma força gravitacional ou eletrostática, 
as coordenadas cartesianas podem ser extraordinariamente inadequadas. Um problema como este exige a utilização 
de um sistema de coordenadas no qual a distância radial é tomada como uma das coordenadas, isto é, coordenadas 
polares esféricas. 

A questão é que o sistema de coordenadas deve ser escolhido para se ajustar ao problema, explorar qualquer 
restrição ou simetria nele presente. Então, é provável que seja resolvido com mais facilidade do que se o forçarmos 
a se ajustar a uma estrutura cartesiana. 

Naturalmente há um preço a pagar pela utilização de um sistema de coordenadas não-cartesiano. Ainda não 
escrevemos expressões para gradiente, divergência ou rotacional em qualquer dos sistemas de coordenadas não- 
cartesianos. Essas expressões são desenvolvidas de forma geral na Seção 2.2. Em primeiro lugar, desenvolvemos 
um sistema de coordenadas curvilíneas, um sistema geral que pode ser particularizado para qualquer dos sistemas 
particulares de interesse. Nós o particularizaremos para coordenadas cilíndricas circulares na Seção 2.4, e para 
coordenadas polares esféricas na Seção (2.5). 


2.1 Coordenadas Ortogonais em R° 


Em coordenadas cartesianas tratamos com três famílias de planos mutuamente perpendiculares: x = constante, 
y = constante, e z = constante. Imagine que sobrepomos a esse sistema três outras famílias de superfícies 
qilx, y, z), à = 1,2,3. As superfícies de qualquer uma das famílias q; não precisam ser paralelas umas às outras 
e não precisam ser planas. Se isso for difícil de visualizar, a figura de um sistema de coordenadas específico 
como o da Figura (2.3) talvez possa ajudar. As três novas famílias de superfícies não precisam ser mutuamente 
perpendiculares mas, por simplicidade, impomos essa condição (Equação (2.7)) porque coordenadas ortogonais são 
comuns em aplicações físicas. Essa ortogonalidade tem muitas vantagens: coordenadas ortogonais são quase iguais 
a coordenadas cartesianas quando áreas e volumes infinitesimais são produtos de diferenciais de coordenadas. 

Nesta seção desenvolvemos o formalismo geral de coordenadas ortogonais, derivamos da geometria e das 
coordenadas diferenciais e os usamos para elementos de linha, de área e de volume em integrais múltiplas e 
operadores vetoriais. Podemos descrever qualquer ponto (x, y, z) como a interseção de três planos em coordenadas 
cartesianas ou como a interseção das três superfícies que formam nossas novas coordenadas cilíndricas. 
Descrevendo as superfícies coordenadas curvilíneas por q; = constante, q2 = constante, q3 = constante, podemos 
identificar nosso ponto por (q1, q2, 3) bem como por (x,y, 2): 


Coordenadas curvilíneas gerais Coordenadas cilíndricas circulares 
q1, q2, 93 P:P, Z 
z = T(q1, 92; 43) —00 < £ = pcos Y < œ (2.1) 
y = y(qı, 92,93) —00 < y = psen Y < œ 
z = z(q1, q2, q3) —00 <2=2<00 


80 
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especificando x, y, z em termos de q1, q2, q3 e das relações inversas 


1/2 
qı = (z, y, z) 0<p = (r+)? <o 
q2 = q2(x, y, z) 0< =arctg(y/x) < 2r (2.2) 
q3 = q3(£,y, Z) —00 <7 =Z <0. 


Como uma ilustração específica das superfícies gerais e abstratas, q1, q2, q3, as equações de transformação para 
coordenadas cilíndricas circulares (Seção 2.4) são incluídas nas Equações (2.1) e (2.2). Com cada família de 
superfícies q; = constante podemos associar um vetor unitário q; normal à superfície q; = constante e na direção 
de q; crescente. Em geral, esses vetores unitários dependerão da posição no espaço. Então, um vetor V pode ser 
escrito 


V = GV + 2V2 + ĝ3 V3, (2.3) 


mas o vetor de coordenadas ou de posição é em geral diferente, 


r Æ Gm + dog + Î393, 


como demonstram os casos especiais r = rf, para coordenadas polares esféricas, er = pp+zZ, para coordenadas 
cilíndricas. Os q; são normalizados a q? = 1 e formam um sistema de coordenadas dextrogiro com volume 
q (ão x 3) > 0. 

A diferenciação de x nas Equações (2.1) leva à variação total ou diferencial 


dx dx dx 
da = d dqp + dgs, 2.4 
Rm + TE T (2.4) 
e, de modo semelhante, por diferenciação de y e z. Em notação vetorial, dr = 5, SE dq. Pelo teorema de 


Pitágoras em coordenadas cartesianas, o quadrado da distância entre dois pontos vizinhos é 
ds? = dz? + dy? + d2?. 


Substituir dr mostra que em nosso espaço de coordenadas curvilíneo o quadrado do elemento de distância pode 
ser escrito como uma forma quadrática nas diferenciais dq;: 


Or Or 
dq Oq; 


ds? = dr - dr = d? = X` dq; dq; 
ij 
= qn dq? + 912 dy dao + 913 dqı dgs 
+ 92 dq2 dqı + 922 dgs + 923 dq2 dq3 
+ 931 dgs day + 932 das dq2 + 933 das 
= 5 Jij dqi dqj, (2.5) 


1J 


em que termos mistos não-zero dq; dq; com i Æ j sinalizam que essas coordenadas não são ortogonais, isto é, que 
as direções tangenciais q; não são mutuamente ortogonais. Espaços para os quais a Equação (2.5) é uma expressão 
legítima são denominados métricos ou riemannianos. 

Escrevendo a Equação (2.5) mais explicitamente, vemos que 


dx dx | Oy Oy | Oz Oz de DY 
inc = ds ; 2. 
g j(qı q2, q3) ôqi Oq; + Oqi dq; Es qi dq; dq Oq; sa 


são produtos escalares dos vetores tangentes A às curvas r para q; = constante, j 4 i. Podemos considerar 
que essas funções de coeficientes g;;, que agora passaremos a investigar, especificam a natureza do sistema de 
coordenadas (q1, q2, q3). Esses coeficientes são denominados coletivamente como métrica e mostraremos na Seção 
(2.10) que formam um tensor simétrico de segunda ordem.! Na relatividade geral os componentes métricos são 


1A natureza tensorial do conjunto g; j resulta da regra do quociente (Seção 2.8). Então, a lei de transformação tensorial dá a Equação (2.5). 
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determinados pelas propriedades da matéria; isto é, as gij são soluções das equações de campo de Einstein com o 
tensor energia-momento como termo condutor. Podemos chamar isso de “geometria e física são imbricadas.” 
Habitualmente nos limitamos a sistemas de coordenadas ortogonais (superfícies mutuamente perpendiculares), 
o que significa (veja o Exercício 2.1.1)? 
9=0, ij) (2.7) 


e ĝi - 4; = 0;;. (Sistemas de coordenadas não-ortogonais são considerados com mais detalhes nas Seções 2.10 e 
2.11 na estrutura da análise tensorial). Agora, para simplificar a notação, escrevemos gi; = h? > 0, portanto, 


ds? = (hı dy)? + (ho dgo)? + (hs das)? = X` (h; dq;)?. (2.8) 


KA 


Os sistemas de coordenadas ortogonais específicos são descritos em seções subsegiientes especificando esses 
fatores de escala (positivos) hı, ho, e h3. Inversamente, os fatores de escala podem ser convenientemente 
identificados pela relação 


ds; = hi dqi, Dr hidi (2.9) 


para qualquer dq;, mantendo todas as outras q constantes. Aqui, ds; é um comprimento diferencial ao longo da 
direção ĝ;. Note que as três coordenadas curvilíneas q1, q2, q3 não precisam ter comprimentos. Os fatores de 
escala h; podem depender de q e podem ter dimensões. O produto h; dq; deve ter uma dimensão de comprimento. 
O vetor de distância diferencial dr pode ser escrito 


dr = hı dqı & + ha dgp ĝ2 + ha das Âs = > hi da; ĝi. 


KA 


Usando essa forma de componente curvilínea, constatamos que uma integral de linha se torna 


[Vw f Vihaa. 


Pela Equação (2.9) podemos desenvolver imediatamente os elementos de área e volume 


do ij = dsi dsj = hihj dqi dqj (2.10) 


dr= dsı ds2 ds3 e hyhohs dqı dq2 dq3. (2.11) 


As expressões nas Equações (2.10) e (2.11) concordam, é claro, com os resultados da utilização das Equações de 
transformação, Equação (2.1) e de jacobianos (descritos resumidamente; veja também o Exercício 2.1.5). 
Pela Equação (2.10) um elemento de área pode ser expandido: 


do = ds2 ds3 îı + ds3 dsı do + ds1 ds2 às 
= haha dgo dq3 Q + haha das day 2 
+ hiho dgy dg ĝ3. 


Uma integral de superfície se torna 


[vao = J Vias das das + | Vaiaha dq dgr 


En I Vzhıhə dqı dq2. 


(Exemplos dessas integrais de linha e de superfície aparecem nas Seções 2.4 e 2.5.) 
Antecipando novas formas de equações para cálculo vetorial que aparecem na próxima seção, vamos enfatizar 
que a álgebra vetorial é a mesma em coordenadas curvilíneas ortogonais e em coordenadas cartesianas. 


2Em cosmologia relativista os elementos não-diagonais da métrica gij costumam ser igualados a zero como consegiiência de hipóteses 
físicas tais como nenhuma rotação, como acontece em dọ dt, d0 dt. 
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Especificamente para o produto escalar, 


AB = S AG WB=> AByðir 
ik ik 


= 3 AB;=41Bj + A2B2 + A3 Bs, (2.12) 


em que os Índices inferiores indicam componentes curvilíneas. Para o produto externo, 


q dp q 
AxB= A As As 3 (2.13) 
Bı B2 Bs 


como na Equação (1.40). 

Antes, particularizamos para coordenadas localmente retangulares que são adaptadas para simetrias especiais. 
Agora vamos examinar brevemente o caso mais geral em que as coordenadas não são necessariamente ortogonais. 
Elementos de superfície e volume são parte de integrais múltiplas que são comuns em aplicações físicas, tais 
como determinações de centro de massa e momentos de inércia. Normalmente escolhemos coordenadas conforme 
a simetria do problema particular. No Capítulo 1 usamos o teorema de Gauss para transformar uma integral de 
volume em uma integral de superfície e o teorema de Stokes para transformar uma integral de superfície em uma 
integral de linha. No caso de coordenadas ortogonais, os elementos de superfície e de volume são simplesmente 
produtos dos elementos de linha h; dq; (veja as equações (2.10) e 2.11)). Para o caso geral, usamos o significado 
geométrico de Or/dq; na Equação (2.5) como vetores tangentes. Começamos com o elemento de superfície 
cartesiano dx dy, que se torna um retângulo infinitesimal nas novas coordenadas q1, q2 formadas pelos dois vetores 
incrementais 


Or 
dry = r(qı + dqr,q2) — r(q1, q2) = da? 
Or 
dra = r(q, q2 + dq2) — r(q1, q2) = Ip (2.14) 


cuja área é a componente z de seu produto externo, ou 


dx dy dx Oy 


dz dy = dry x dra | = dg d 
a dy = dra x dral, Om ðq2  Oqo Oq Fes 
dr dr 
= a E day dgo. (2.15) 
Oq dq 


O coeficiente de transformação em forma de determinante é denominado jacobiano. 
De maneira semelhante, o elemento de volume da dy dz se torna o produto escalar triplo dos três vetores de 
deslocamento infinitesimal dr; = dq; E ao longo das q; direções qi, que, de acordo com a Seção 1.5, toma a 


forma 


da dy dz = Dur, SO 2 dg dqz dgs. (2.16) 


Aqui, o determinante também é denominado jacobiano, e assim por diante em dimensões mais altas. 
Para coordenadas ortogonais, os jacobianos simplificam-se para produtos dos vetores ortogonais na Equação 
(2.9). Resulta que eles são produtos exatos dos h;; por exemplo, do volume jacobiano se torna 


hıhzh3(ĝı x d>) -3 = hyhohs, 


e assim por diante. 
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Exemplo 2.1.1 JACOBIANOS PARA COORDENADAS POLARES 


Vamos ilustrar a transformação do elemento de volume cartesiano bidimensional dx dy para coordenadas polares 
p, p, com z = pcos y, y = psen Y. (Veja também a Seção 2.4. Aqui, 


ðx dx 
dp g cosy —psen y 
dxzdy = dp dy = do dy = pdpd 
ðy Oy |P ; pap = pap agp. 
a e seny pcos 
De modo semelhante, em coordenadas esféricas (veja a Seção 2.5) obtemos, de x = rsen 0 cosy, y = 
rsen sen p, z = r cos 6, o jacobiano 
ðr du dx 
ðr 00 Əş sen cosy rcosĝcosy —rsen Bsen y 
— | 24 dy Oy N ; 7 
J=| o æ od |=| sen Osen y rcosdseny rsen ĝ cosy 
Oz O dz cos 6 —rsen 0 0 
or 0 dp 
r cos 0 cos —rsen sen sen 8 cos —rsen sen 
= cos0 P P | + rsenð P P 
rcosĝseny rsen ĝ cos y sen sen y rsen ĝ cos y 


=r? (cos? Osen 0 + sen?0) = r2sen 6, 


expandindo o determinante ao longo da terceira linha. Daí o elemento de volume se torna dx dydz = 
r? drsen 0 d0 dy. A integral de volume pode ser escrita como 


j f(x,y,z) dz dy dz = / Fatr, 0,9), uy(r,0,9), 2(r,0, p))r? drsen 0 d0 dy. 

E 

Resumindo, desenvolvemos o formalismo geral para análise vetorial em coordenadas curvilíneas ortogonais 

em R?. Para a maioria das aplicações, podem ser escolhidas coordenadas localmente ortogonais para as quais 

os elementos de superfície e de volume em integrais múltiplas são produtos de elementos de linha. Para o caso 
não-ortogonal geral, os determinantes jacobianos se aplicam. 


Exercícios 
2.1.1 Mostre que limitar nossa atenção a sistemas de coordenadas ortogonais implica que g;; = O será 
i Æ j (Equação (2.7)). 
Sugestão: Construa um triângulo de lados dsı, ds2 e ds3. A Equação (2.9) deve valer 
independentemente de g;; = 0 ou não. Então compare ds? da Equação (2.5) com um cálculo que 
utilize a lei dos co-senos. Mostre que cos 012 = g12/ 911922. 


2.1.2 No sistema coordenado polar esférico, qq = r, q2 = 0, q3 = y. As equações de transformação 
correspondentes à Equação (2.1) são 


x = rsen l cos g, y = rsen sen q, z = r cos. 


(a) Calcule os fatores de escala de coordenadas polares esféricas: hy, ho e ho. 
(b) Verifique os fatores de escala que calculou pela relação ds; = hi dqi. 


2.1.3 O sistema de coordenadas u, v, z usado com muita frequência em eletrostática e hidrodinâmica é 
definido por 


ty =u, Tv >y =N, AA 


Esse sistema u, v, z é ortogonal. 


(a) Com suas próprias palavras, faça uma breve descrição da natureza de cada uma das três famílias 
de superfícies coordenadas. 

(b) Esboce o sistema no plano xy mostrando as interseções de superfícies de u constante e 
superfícies de v constante com o plano xy. 

(c) Indique as direções dos vetores unitários û e em todos os quatro quadrantes. 

(d) Por fim, esse sistema u, v, z é dextrogiro (à x = +2) ou levogiro (à x Y = —2)? 


2.1.4 O sistema de coordenadas cilíndrico elíptico consiste em três famílias de superfícies: 


2 2 2 2 
x y f 2) £ y 


+ =1 
a2cosh2u — a2sen h2u á a2cos2v qa? sen?v 


=l; 3)z=2. 
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Esboce as superfícies coordenadas u = constante e v = constante na interseção com o primeiro 
quadrante do plano xy. Mostre os vetores unitários à e v. O intervalo de uv é 0 < u < 00.0 
intervalo de vé 0 < v < 27. 


2.1.5 Um sistema ortogonal bidimensional é descrito pelas coordenadas qı e q2. Mostre que o jacobiano 


i £, Y ) _ x,y) _ Ox ðy dx Oy sd 
qe)” mg) 3q ðq qð "? 


está de acordo com a Equação (2.10). 


Sugestão: É mais fácil trabalhar com o quadrado de cada lado dessa equação. 


2.1.6 No espaço de Minkowski definimos xı = £, £2 = Y, £3 = ze xo = ct. Fazemos isso para que o 
intervalo métrico se torne ds? = dx2 — dx? — dx3 — dx? (com c = velocidade da luz). Mostre que a 
métrica no espaço de Minkowski é 


10 0/0 
{|o -1 0 0 
w=] o 0 20 
0 0 0 = 


Usamos o espaço de Minkowski nas Seções 4.5 e 4.6 para descrever as transformações de Lorentz. 


2.2 Operadores Vetoriais Diferenciais 
Voltamos à nossa restrição a sistemas coordenados ortogonais. 


Gradiente 

O ponto de partida para desenvolver os operadores de gradiente, de divergência e de rotacional em coordenadas 
curvilíneas é a interpretação geométrica do gradiente como o vetor que tem a grandeza e a direção da máxima 
taxa de mudança espacial (compare com a Seção 1.6). Por essa interpretação, a componente de V y(q1, 2,43) na 
direção normal à família de superfícies q; = constante é dada por” 


Eis 
ası hı Oq 


Ga Vy = Vyhl (2.17) 
uma vez que essa é a taxa de mudança de 1) variando qı e mantendo q2 e q3 fixas. A quantidade ds, é um 
comprimento diferencial na direção de qı crescente (compare com as Equações (2.9)). Na Seção 2.1 apresentamos 
um vetor unitário Q1 para indicar essa direção. Repetindo a Equação (2.17) para q2 e novamente para q3 e fazendo 
a adição vetorial, vemos que o gradiente se torna 


.Ô o) o) 
Vúlga,q2,03) = ár + dos ta 
“10% .104 104 
+ + 
1 hı ðq 1 ho q2 13 h3 q3 
. 1 y 
DL (2.18) 


O Exercício 2.2.4 oferece uma alternativa matemática independente dessa interpretação física do gradiente. A 
variação total de uma função, 
194 d oy 


= dgi 


= . dr = —-— ds; = ZA 
PUE SAR 7 hi aqi É z aqi 


é consistente com a Equação (2.18), é claro. 


3Evitamos aqui a utilização de «o para rotular uma função porque, por convenção, esse símbolo é usado para denotar uma coordenada 
azimutal. 
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Divergência 
O operador de divergência pode ser obtido da segunda definição da Equação (1.98), do Capítulo 1 ou também pelo 
teorema de Gauss, Seção 1.11. Vamos usar a Equação (1.98), 


V.d 
V- V(q,q2,43)= lim J E 


jaso far” feria 


com um volume diferencial hı hah dqı dq2 dgs (Figura 2.1). Note que as direções positivas foram escolhidas de 
modo que (G1, 42, 43) formem um conjunto dextrogiro, q X 2 = ĝ3. 
A diferença de integrais de áreas para as duas faces q; = constante é dada por 


(8) 
Vihəh3 + gg V2) dqı | dq2 dq3 — Vihahs dq2 dq3 
1 


ð 
= zg, (Vihaha) dan das das, (2.20) 
qı 


N 


Figura 2.1: Elemento de volume curvilíneo. 


exatamente como nas Seções 1.7 e 1.10.4 Aqui, V; = V - q; é a projeção de V sobre a direção q;. Somando os 
resultados semelhantes para os outros dois pares de superfícies, obtemos 


[Vma -do 


o ð ð 
= |=—(Vihzh3) + =— (Vzh3h1) + =—(Vzhıh2)| dqı dao das. 
Ea 1/2 3) a! 2h3 1) da! 3h ) qı Aga 443 


Agora, usando a Equação (2.19), a divisão por nosso volume diferencial resulta em 


1 (8) ð ð 
V- V(q, 42,43) = RAT [E rano) + Bag ah) SH so Vshha)]. (2.21) 


Podemos obter o laplaciano combinando as Equações (2.18) e (2.21), usando V = Vi(gr, q2, q3). Isso leva a 


V- Vila, 42,43) 


1 ð (hohs x) ð (mo x) ð Eu x)| 
5 hi $ 2.22 
hahaha E ( hı ôq q2 \ h2 dq Oq \ h3 das (aaa 


4Uma vez que tomamos o limite dg1, dq2, dq3 — 0, as derivadas de segunda ordem e de ordens mais altas serão descartadas. 
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Rotacional 

Por fim, para desenvolver V x V, vamos aplicar o teorema de Stokes (Seção 1.12) e, como fizemos com 
a divergência, tomar o limite, à medida que a área da superfície torna-se cada vez menor, tendendo a zero. 
Trabalhando com uma componente por vez, consideramos um elemento de superfície diferencial na superfície 
curvilínea qı = constante. De 


fy x V -do = à i (V x V)hshs daz dq3 (2.23) 
(teorema do valor médio do cálculo integral), o teorema de Stokes resulta 
dı y (V x V)hsahs dq dq3 = fy s dr, (2.24) 


com a integral de linha sobre a superfície qı = constante. Acompanhando o circuito fechado (1, 2, 3, 4) da Figura 
22, 


ð 
f Via, q2, q3) - dr = Vaho dq2 + [ata + Dag (8h3) A dq3 
2 


ð 
— [vah + Do (Vaha)das! dq2 — V3hs dq3 
3 


ð ð 
= | (h3 V3) (avi) dgo dgs. (2.25) 
dgo q3 


Escolhemos um sinal positivo quando percorremos a direção positiva nas partes 1 e 2 e um sinal negativo 
nas partes 3 e 4 porque aqui estamos indo na direção negativa. (Termos de ordens mais altas foram omitidos em 
expansões de Maclaurin ou Taylor. Eles se anularão à medida que a superfície ficar cada vez menor, tendendo a 
zero (dq2 — 0, dq3 > 0).) 

Pela Equação (2.24)), 

o 


VxVh= (h3V3) 2 (ava): (2.26) 


q3 


hahg E 


pan 


=y 


Figura 2.2: Elemento de superfície curvilínea com qı = constante. 


As duas componentes restantes de V x V podem ser obtidas por permutação cíclica dos índices. Como no 
Capítulo 1, muitas vezes é conveniente escrever o rotacional em forma de determinante: 


ql ĝzh2 shz 


geve ð ə ð) (2.27) 
hahaha dn q2 g3 
haVi hoVo hV 
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Lembre-se de que, por causa da presença dos operadores diferenciais, esse determinante deve ser expandido de 
cima para baixo. Note que essa equação não é idêntica à forma para o produto externo de dois vetores (Equação 
(2.13)). V não é um vetor comum; é um operador vetorial. 

Nossa interpretação geométrica do gradiente e a utilização dos teoremas de Gauss e de Stokes (ou definições 
integrais de divergência e rotacional) nos habilitaram a obter essas quantidades sem ter de diferenciar os vetores 
unitários q;. Existem modos alternativos para determinar grad, div e rot com base em diferenciação direta dos ĝ;. 
Uma dessas abordagens expressa os q; de um sistema de coordenadas específico em suas componentes cartesianas 
(Exercícios 2.4.1 e 2.5.1) e diferencia essa forma cartesiana (Exercícios 2.4.3 e 2.5.2). A questão aqui é que as 
derivadas dos £, y e Z cartesianos desaparecem, visto que a direção bem como o módulo de £, y e Z são constantes. 
Uma segunda abordagem [L. J. Kijewski, Am. J. Phys. 33: 816 (1965)] admite a igualdade de 092r/0q; ðq; e 
92r/0q; Oq; e desenvolve as derivadas de q; em uma forma curvilínea geral. Os Exercícios 2.2.3 e 2.2.4 são 
baseados nesse método. 


Exercícios 
2.21 Desenvolva argumentos para mostrar que produtos escalares e vetoriais (que não envolvam V) em 
coordenadas curvilíneas ortogonais em R são calculados, como em coordenadas cartesianas, sem 
nenhum envolvimento de fatores escalares. 


2.2.2 Tendo à; como um vetor unitário na direção crescente de qı, mostre que 
1º 9hoh 
(a) Vå = an 
hiıhzh3 Oq 
x Eio 10h ~ 10h 
(b) V xå = - - 


q2 q3 . 
hı hz qz h2 dgp 
Note que, mesmo que ĝı seja um vetor unitário, sua divergência e rotacional não desaparecem 


necessariamente. 
2.2.3 Mostre que os vetores unitários ortogonais q; podem ser definidos por 
a 1 Or 
= A (a) 
hi Ogi 


Em particular, mostre que į; - q; = 1 leva a uma expressão para h; de acordo com as Equações 
(2.9). A Equação (a) pode ser tomada como um ponto de partida para derivar 


ð: 10h; TE 
do Da if) 
e 
ði ~ 1 Oh; 
Oqi ii 7 hj ddj 


2.2.4 Derive 
1 ðy . 1p 10% 


Vy = 6 + F 
raa mia Shop hJ% 
por aplicação direta da Equação (1.97), 
d 
Vy= lim pda 
Jár>o fdr 


Sugestão: A avaliação da integral de superfície resultará em termos como (h1h2h3) !(0/0q1) x 
(Qihsh3). Os resultados listados no Exercício 2.2.3 são úteis. O cancelamento de termos 
indesejados ocorre quando as contribuições de todos os três pares de superfícies são somadas. 


2.3 Sistemas de Coordenadas Especiais: Introdução 

Há pelo menos 11 sistemas de coordenadas nos quais a equação tridimensional de Helmholtz pode ser 
desmembrada em três equações diferenciais comuns. Alguns desses sistemas de coordenadas conseguiram 
proeminência no desenvolvimento histórico da mecânica quântica. Outros sistemas, tal como o de coordenadas 
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bipolares, satisfazem necessidades especiais. Em parte porque as necessidades não são muito freqüentes, mas 
principalmente porque o desenvolvimento de computadores e de técnicas de programação eficientes reduziu a 
necessidade desses sistemas de coordenadas, a discussão neste capítulo é limitada a (1) coordenadas cartesianas, 
(2) coordenadas polares esféricas e (3) coordenadas cilíndricas circulares. Especificações e detalhes dos outros 
sistemas coordenados podem ser encontrados nas duas primeiras edições desta obra e nas Leituras Adicionais ao 
final deste capítulo (Morse e Feshbach, Margenau e Murphy). 


2.4 Coordenadas Cilíndricas Circulares 


No sistema de coordenadas cilíndricas circulares as três coordenadas curvilíneas (q1, q2, q3) são rotuladas (p, p, 2). 
Estamos usando p para a distância perpendicular em relação ao eixo z e guardando r para a distância a partir da 
origem. Os limites de p, p e z são 


0O<p<o, 0O<p<27, e — 00 <z <. 


Para p = 0, y não é bem definido. As superfícies coordenadas (mostradas na Figura 2.3) são: 
1. Cilindros circulares para a direita (dextrogiros) que têm o eixo z como um eixo em comum, 


a 


p= (£? +y?) É = constante. 


2. Semiplanos que passam pelo eixo z, 
— ("= 
p = tg — |) = constante 
g4 
3. Planos paralelos ao plano xy como no sistema cartesiano, 


z = constante 


Figura 2.3: Coordenadas cilíndricas circulares. 


Invertendo as equações precedentes para p e p (ou indo diretamente à Figura 2.3), obtemos as relações de 
transformação 


z = pcosç, y = psen 9, Z= (2.28) 
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Rey 


X 


Figura 2.4: Vetores unitários em coordenadas cilíndricas circulares. 


O eixo z permanece inalterado. Este é, em essência, um sistema curvilíneo bidimensional com a adição de um eixo 
cartesiano z para formar um sistema tridimensional. 
Conforme a Equação (2.5) ou pelos elementos de comprimento ds;, os fatores de escala são 


hi =h =1, h2 = hy = p, hs=h,=1. (2.29) 


Os vetores unitários Q1, q2, q3 recebem novas denominações (Ô, $, Z), como na Figura 2.4. O vetor unitário 
P é normal à superfície cilíndrica, apontando na direção do raio crescente p. O vetor unitário P é tangencial à 
superfície cilíndrica, perpendicular ao semiplano y = constante e aponta na direção do ângulo azimutal crescente 
g. O terceiro vetor unitário, Z, é o vetor unitário cartesiano usual. Eles são mutuamente ortogonais, 


A 


Pop=Pi=2:0=0, 
e o vetor coordenado e um vetor geral V são expressos como 
r= ppt 2z, V = ÒV, + Vo + 2V. 
Um deslocamento diferencial dr pode ser escrito como 


dr = p dsp + È ds + 2 dz 
= pdpo+ p dọ + ĉ dz. (2.30) 


Exemplo 2.4.1 LEI DA ÁREA PARA MOVIMENTO PLANETÁRIO 


Em primeiro lugar derivamos a lei de Kepler em coordenadas cilíndricas dizendo que o vetor raio abrange áreas 
iguais em tempos iguais, pela conservação do momento angular. 

Consideramos o Sol localizado na origem como uma fonte da força gravitacional central F = f(r)f. Então, o 
momento angular orbital L = mr x v de um planeta de massa m e velocidade v é conservado porque o torque 


so ns pa O) 


dt CHAO dt EAD: 


Por conseguinte, L = constante. Agora podemos determinar que o eixo z se estende ao longo da direção do vetor 
do momento angular orbital, L = LZ, e trabalhar em coordenadas cilíndricas r = (p,,2) = pp com z = 0. 
O planeta se move no plano xy porque r e v são perpendiculares a L. Assim, expandimos sua velocidade como 
segue: 


dr »d + dp 
y = — = — 
d PTPN 
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5 op à 

P = (cos p, sen q), eF (—sen y, cos p) = à, 
constatamos que a = PE = pġ usando a regra da cadeia, portanto v = pô + pé = pp + ppp. Quando 


substituímos as expansões de p e v em coordenadas polares, obtemos 


L = mp x v = mpl pY) (À x Q) = mp? hÊ = constante. 
A área triangular abrangida pelo vetor raio p no tempo dt (lei da área), quando integrada sobre uma revolução, 
é dada por 


1 À ii, L o Lr 
A=5 |od) =3 [Ppdt= 5 fa, (2.31) 


se substituirmos mp2y = L = constante. Aqui, 7 é o período, isto é, o tempo para uma revolução do planeta em 
sua órbita. 

A primeira lei de Kepler afirma que a órbita é uma elipse. Agora derivamos a equação orbital p(y) da elipse 
em coordenadas polares, em que na Figura 2.5 o Sol está em um foco, que é a origem de nossas coordenadas 
cilíndricas. A partir da construção geométrica da elipse sabemos que p' + p = 2a, em que a é o semi-eixo maior; 
mostraremos que isso equivale à forma convencional da equação da elipse. A distância entre ambos os focos é 
0 < 2ae < 2a, em que O < e < 1 é denominado excentricidade da elipse. Para um círculo, € = O porque ambos 
os focos coincidem com o centro. Há um ângulo, como mostra a Figura 2.5, em que as distâncias p' = p = a 
são iguais e o teorema de Pitágoras aplicado a esse triângulo retângulo dá b? + a?e? = a?. Como resultado, 
v1 — e = b/a é a razão entre o semi-eixo menor (b) e o semi-eixo maior a. 


a x 
q 


Figura 2.5: Elipse em coordenadas polares. 


Agora considere o triângulo de lados denominados p’, p, 2ae na Figura 2.5 e ângulo oposto p’ igual a 7 — q. 
Então, aplicando a lei dos co-senos, obtemos 


P? = P? + 4a? + 4paecos o. 
Agora, substituindo p' = 2a — p, cancelando p°? em ambos os lados e dividindo por 4a, temos 
p(1L+ecosp)=a(1-) =p, (2.32) 


a equação da órbita de Kepler em coordenadas polares. 
Alternativamente, revertemos às coordenadas cartesianas para constatar, pela Equação (2.32) com x = pcos p, 
que 


P =? +y = (p — ze)? = p + xe — 2pre, 
portanto, a familiar equação da elipse em coordenadas cartesianas, 


E pe 2 3 7 pe p 
(1-)(2+85) ds Ee 


continua em vigor. Se compararmos este resultado com a forma padrão da elipse, 


(r> 20) y 
E qá 
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confirmamos que 


= ei os TO PA ef 
CR É 1— e, a= TES 


e a distância xo entre o centro e o foco é ae, como mostra a Figura 2.5. 
As operações diferenciais envolvendo V resultam das Equações (2.18), (2.21), (2.22) e (2.27): 


o) No) „0 
a 18V, oV; 
V.V = L gv) Dee p Po (2.34) 
2 10 ee 1 8Y 8Y 

v= ael e Ta (235) 

Ô pp z 
UR ANP (2.36) 

P| dp dp Oz 

Vo Vo V: 


Por fim, para problemas como guias de ondas circulares e ressonadores de cavidade cilíndrica, o vetor W2V 
laplaciano resolvido em coordenadas cilíndricas circulares é 


1 2 ƏV, 
V?V|, = V?V, V ? 
lp P p2 P p2 dy , 
1 2 ƏV, 
VêVlo = VV, 3 Vo + 2 do (2.37) 
V?V| = VV, 


que resulta da Equação (1.85). A razão básica para esta forma particular da componente z é que o eixo z é um eixo 
cartesiano; isto é, 


V?(AV, + PV, + 2V.) = V?(AV, + PV) + 2V2V. 
= Pf (Vp, Vo) + Qg(Vp, Vo) + 2V? Vz. 


x 2 ORD a rs N 
Finalmente, o operador VW? que opera sobre os vetores unitários p, œ permanece no plano pQ. 


Exemplo 2.4.2 Um TERMO DE NAVIER-STOKES 


As Equações de Navier-Stokes da hidrodinâmica contêm um termo não-linear 
Vx[vx(Vxv)], 


em que v é a velocidade do fluido. Para um fluido que escoa por um cano cilíndrico na direção z, 


v = ĉv(p). 
Pela Equação (2.36), 
ô P ĉ 
Vxv= l ð ə Ə jog a 
P| dp dp Oz dp 
0 0 v(p) 
Pp Pp z 
0 0 v ž ðv 
x (Y xv)= = pol) Z. 
0 s 0 dá 
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Finalmente, 
Ô pp żĉ 
o o (9) 
ES UA do dp O |=0, 
ðv 
v— 0 0 
dp 


portanto, para este caso particular, o termo não-linear se anula. 


Exercícios 


2.4.1 


2.4.2 


2.4.3 


2.4.4 


2.4.5 


2.4.6 


2.4.7 


Decomponha os vetores unitários cilíndricos circulares em suas componentes cartesianas (Figura 
2.6). 


Resposta: ò = cosy + sen q, 
$ = —Ìgsen y + ŷŶ cos gp, 
2 = 8. 

Decomponha os vetores unitários cartesianos em suas componentes cilíndricas circulares (Figura 
2.6). 


RESP.Xx = pcosy-— ĝsen y, 
ý = pPsnp+Qcosy, 
2 = 2. 


Pelos resultados do Exercício 2.4.1 mostre que 


ə do 
do” P dp 


a 


e que todas as outras derivadas de primeira ordem dos vetores unitários cilíndricos circulares em 
relação às coordenadas cilíndricas circulares se anulam. 


Compare V - V (Equação (2.34)) com o operador gradiente 
ð 19 o 


Ta T COR 


V=; 


(Equação (2.33)) multiplicado escalarmente por V. Note que os operadores diferenciais de V 
diferenciam ambos os vetores unitários e as componentes de V. 

Sugestão: P(1/p)(O/09) - PV, se torna q - Los (PV) e não se anula. 

(a) Mostre que r = pp + ĉz. 

(b) Trabalhando inteiramente em coordenadas cilíndricas circulares, mostre que 


V.r=3 e Vxr=-0. 


(a) Mostre que a operação de paridade (reflexão passando pela origem) sobre um ponto (p, p, 2) 
relativa aos eixos fixos x, y, z consiste na transformação 


Pp. Mep z=>-2. 


(b) Mostre que p e & têm paridade ímpar (reversão de direção) e que Z tem paridade par. 

Nota: Os vetores unitários cartesianos X, ý e Z permanecem constantes. 

Um corpo rígido está em rotação ao redor de um eixo fixo com uma velocidade angular constante 
w. Admita que w está ao longo do eixo z. Expresse o vetor posição r em coordenadas cilíndricas 
circulares e, usando coordenadas cilíndricas circulares, 

(a) calcule v = w xr, (b)calcule V x v. 


“livro” — 2007/8/1 — 15:06 — page 94 — #104 


94 Física Matemática Arfken e Weber ELSEVIER 
Ay 
Figura 2.6: Coordenadas polares planas. 
2.4.8 Ache as componentes cilíndricas circulares da velocidade e da aceleração de uma partícula em 
movimento, 
Vp = P, ap = p- pġ’, 
Vo =pp, dp = p$ + 2pp, 
Uz = 2, az= 2: 
Sugestão: 
r(t) = p(t)p(t) + Zz(t) 
= [R cos y(t) + ysen y(t)] p(t) + Zz(t) 
Nota: b = dp/dt, p = d?’ p/dt?, e assim por diante. 
2.4.9 Resolva a Equação de Laplace, V?y = 0, em coordenadas cilíndricas para Y = (p). 
Resposta: Y% = kln Es 
Po 
2.4.10 Em coordenadas cilíndricas circulares voltadas para a direita, uma determinada função vetorial é 
dada por 
V(o, 9) = PVolp, p) + Volp, p). 
Mostre que V x V tem somente uma componente z. Note que esse resultado valerá para qualquer 
vetor confinado à superfície q; = constante, contanto que cada um dos produtos h: Vi; e h2 V2 seja 
independente de q3. 
2.4.11 Para o escoamento de um fluido viscoso incompressível, as equações de Navier-Stokes levam a 


-V x (v x (V x v)) = A x v). 


Aqui, ņ é a densidade do fluido. Para escoamento axial em um cano cilíndrico admitimos que a 
velocidade v é 


Pelo Exemplo 2.4.2, 


para essa escolha de v. 


ELSEVIER 
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2.4.12 


2.4.13 


2.4.14 


2.4.15 


2.4.16 


2.4.17 


Mostre que 
VV xv)=0 


e que essa expressão leva à equação diferencial 


ld du 1 dv 
p =0 
pdp\ dp?) pêdp 


e que essa expressão é satisfeita por 


2 
v = vo + agp”. 


Um fio condutor ao longo do eixo z transporta uma corrente 7. O potencial vetor magnético 
resultante é dado por 
«ul 1 
pu asp fe 
27 p 


Mostre que a indução magnética B é dada por 


> HI 
TP 
Uma força é descrita por 
A y +9 T 
X . 
g2 + y? J: r2 + y’ 
(a) Expresse F em coordenadas cilíndricas circulares. 


Operando inteiramente em coordenadas cilíndricas circulares para (b) e (c), 


(b) calcule o rotacional de F e 

(c) calcule o trabalho realizado por F para percorrer o círculo unitário uma vez em sentido anti- 
horário. 

(d) Como você concilia os resultados de (b) e (c)? 

Uma onda eletromagnética transversal (transverse electromagnetic wave — TEM) em um guia de 

onda coaxial tem um campo elétrico E = E(p,)e'(*=-“t) e um campo de indução magnética 

B = B(p, p)etlkz =t), Uma vez que a onda é transversal, nem E nem B têm uma componente z. 

Os dois campos satisfazem a equação vetorial de Laplace 


VºE(p,9)=0 
VºB(p, 9) =0. 
(a) Mostre que E = AEo(a/p)et 47—48 e B = GBo(a/p)e'2—“t) são soluções. Aqui, a é o raio 
do condutor interno e Eo e Bo são amplitudes constantes. 


(b) Admitindo um vácuo dentro do guia de onda, verifique que as equações de Maxwell são 
satisfeitas com 


Bo/Eo = k/w = uoco(w/k) = 1/c. 
Um cálculo do efeito de pinçamento (pinch) magneto-hidrodinâmico envolve a avaliação de 
(B - V)B. Se a indução magnética B for considerada B = $ B,(p), mostre que 
(B- V)B=5B2/p. 


A velocidade linear de partículas em um corpo rígido que está em rotação com velocidade angular 
w é dada por 


v = pw. 
Integre $ v - dA ao redor de um círculo no plano zy e verifique que 


fv-dà 


área 


= V x vjz. 


Um próton de massa m, carga +e e momento (assintótico) p = mv incide sobre um núcleo de carga 
+Ze a um parâmetro de impacto b. Determine a distância de maior aproximação do próton. 
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2.5 Coordenadas Polares Esféricas 
Designando (q1, q2, q3) por (r, 0, p), vemos que o sistema de coordenadas polares esféricas consiste no seguinte: 


1. Esferas concêntricas centradas na origem, 


Da 


r= (£? +y? +2?) = constante. 


2. Cones circulares retos centrados no eixo (polar) z com vértices na origem, 


z 
0 = arccos (ER AIR = constante. 


3. Semiplanos que passam pelo eixo polar z, 
= Y 
p = arcig> = constante 
z 


Por causa de nossa escolha arbitrária de definições de 0, o ângulo polar, e y, o ângulo azimutal, o eixo z merece 
tratamento especial. As equações de transformação correspondentes à Equação (2.1) são 


x = rsen 0 cos f, y = rsendsen q, z =r cos, (2.38) 


Equação (2.40) 


Figura 2.7: Elementos de área em coordenadas polares esféricas. 


medindo 6 a partir do eixo z positivo e no plano xy a partir do eixo x positivo. As faixas de valores são O < r < 00, 
0<80<re0< y< 2r.Emr =Q, de y são indefinidos. Por diferenciação da Equação (2.38), 


hi= h =1, 
hə = ho =r, (2.39) 
h3 = họ = rsen 0. 


Isso dá um elemento de linha 
dr = ĉdr + Or d0 + rsen 0 dy, 


portanto 
ds? = dr - dr = dr? + r?d8? + r2sen?0 dç?, 
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e as coordenadas são obviamente ortogonais. Nesse sistema coordenado esférico, o elemento de área (para 


r = constante) é 
dA = dog, = r°sen 0 dO dy, (2.40) 


a área clara, não-sombreada, na Figura 2.7. Integrando sobre o azimute «o, constatamos que o elemento de área se 


transforma no anel de largura d0, 
dAp = ?nr2sen 0 do. (2.41) 


Essa forma aparecerá repetidas vezes em problemas em coordenadas polares esféricas com simetria azimutal, tal 
como a dispersão de um feixe de partículas não-polarizado. Por definição de radianos sólidos, ou estereorradianos, 
um elemento de ângulo sólido df é dado por 


dA 
dO = — = sen 0 d0 dy. (2.42) 
r 


N 


>) 
Figura 2.8: Coordenadas polares esféricas. 
Integrando sobre toda a superfície, obtemos 
dO = 47. 
Pela Equação (2.11) o elemento de volume é 
dr = r? drsen 6 do dy = r° dr dQ.. (2.43) 


Os vetores unitários em coordenadas polares esféricas são mostrados na Figura 2.8. 

É preciso salientar que a direção dos vetores unitários f, Ô e © varia à medida que os ângulos 8 e p variam. 
Especificamente, as derivadas 0 e y desses vetores unitários em coordenadas polares esféricas não desaparecem 
(Exercício 2.5.2). Quando diferenciamos vetores em um sistema polar esférico (ou em qualquer sistema não- 
cartesiano), essa variação dos vetores unitários com a posição não deve ser desprezada. Em termos dos vetores 
unitários cartesianos de direção fixa X, Y e Z (cf. Equação (2.38)), 


f 


Xsen 0 cos y + ysen Osen y + ĉ cos 0, 
of 
Xcosôcosy + y cos Osen y — Zsen 0 = 5 ; (2.44) 
1 Or 
sen 9 dy ' 


DB» 
II 


Ẹ = —ŝsen y + f cos Y = 
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que resultam de 


= — î. — f. i 
0 20º 3p dy 
Note que o Exercício 2.5.5 dá a transformação inversa e que um determinado vetor agora pode ser expresso de 
vários modos diferentes (porém equivalentes). Por exemplo, o vetor posição r pode ser escrito da forma 


2 2 Be 


= Xrsen Ô cos y + yrsen Osen y + Êr cos 0. (2.45) 


Selecione a forma que for mais útil para seu problema particular. 
Pela Seção 2.2, denominando os vetores unitários coordenados curvilíneos ĝ1, &> e 3 como f, O e P, temos 


Op alôb , 1 æ 
E AR Or a f o0 t P sen 0 dp" em 
o 1 O o oV; 
V.V = a [5 O Vi) + rag(sen avo) tre], (2.47) 
o 0 (200). O ow 1 8y 
V-Vy = RS sen O (+ 5) BO (sen o2) tp Joz |" (2.48) 
ĉê rÔ rsen [ndo 
TRN Es =D SO” or (2.49) 
rsen6 | ðr 0d dy 
V. rW rsenôOV, 


Há ocasiões em que precisamos do laplaciano vetorial W2V em coordenadas polares esféricas. O melhor modo 
de obtê-lo é usar o vetor identidade (Equação (1.85)) do Capítulo 1. Como referência 
Dios RD 0? cos O 192 1 æ ) 


VºV| = 
| ( r2 E r Or E Or? E r2sen 0 90 E r2 96º a r2sen20 dp? 


E 20 2 cos 0 V,+ 2 o v 
r280  r?senðj * r2sen0 dp) ? 


2 2 Vo  2cos0 2 øV, 
= V?V, V, é 2.50 
r? r2 00  r?senð °  r?senð dp! (220) 
1 2 ƏV, 2cos0 oV, 
V?V]e = VV V; 7 £ 2.51 
lo ? r2sen2o ° e r? 00  r2senZ0 dp' Re) 
1 2 OV, 2cos0 oV; 
2 = 2 r [5] 
A r2sen2g ? Ng r2send dp  r2senZo dp. Caa 


Não se pode negar que essas expressões para as componentes de V?V são confusas, mas às vezes são necessárias. 


Exemplo 2.5.1 V, V -, Vx PARA UMA FORÇA CENTRAL 
Usando as Equações (2.46) a (2.49 ), podemos reproduzir por inspeção alguns dos resultados derivados no 
Capítulo 1 pela trabalhosa aplicação de coordenadas cartesianas. 


Pela Equação (2.46), 
«df 
SE St a (2.53) 
Vre = fnr, 
Para o potencial de Coulomb V = Ze/(4reor), o campo elétrico é E = -V V = mei. 
Pela Equação (2.47), 
vise) = Zro) 
E pA Ee (2.54) 


Vêre = (n+2)r®t. 
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Para r > 0, a densidade de carga do campo elétrico do potencial de Coulomb é p = V -E = V. É =0 


4TEo r 
porque n = —2. 
Pela Equação (2.48), 
2df Ëf 
2 ; 
= nt jura 2. 
IS no (2.55) 
V?r” = n(n + Dr, (2.56) 
em contraste com a derivada de segunda ordem radial ordinária de r” que envolve n — 1 em vez de n + 1. 
Por fim, pela Equação (2.49), 
Vxtf(r)=0. (2.57) 
E 


Exemplo 2.5.2 POTENCIAL VETOR MAGNÉTICO 


O cálculo do potencial vetor magnético de um único circuito de corrente no plano xy usa a lei de Oersted, 
V x H = J, em conjunção com u,H = B = V x A (veja os Exemplos 1.9.2 e 1.12.1) e envolve a avaliação de 


moJ=Vx[VxpAç(r,0)). 
Em coordenadas polares esféricas, essa expressão se reduz a 


rô rsen dp 


f 
J= ð ə f2] 
nl x aena a DE dp 
0 0 rsendA,(r,0) 
1 „0 PO) 
=Vx “sen 0 [E 90 (rsen 04,) — rôz; (rsen 0A,)|. 


Tomando o rotacional uma segunda vez, obtemos 


î rô rsen dp 
a o o o 
Ho! = r2sen 0 dê Ea dp 
1 1 
Peno 30 (rsen 04) = Eno dr (rsen 04) 0 


Expandindo o determinante ao longo da linha superior, temos 


[1 8 1ə3| 1 ə 
HoJ = -of 2 0A) +7290 hace 04,)| | 


=- [vAr 6) TsendO Moe o) ; (2.58) 
E 
Exercícios 
2.5.1 Expresse os vetores unitários polares esféricos em vetores unitários cartesianos. 
Resposta: ? = xXsenfcosy+ysen Osen y + ĉ cos 0, 
Ô = cosOcosy + cosbsen y — ĉsen 6, 
Pp = —ŝsen y + cosy. 
2.5.2 (a) Pelos resultados do Exercício 2.5.1, calcule as derivadas parciais £, Ô e © em relação a r, 0 e ọ. 
(b) Com V dado por 
è o +ô 10 » 1 
or r 96 rsen 0 dy 


(maior taxa de mudança espacial), use os resultados da parte (a) para calcular V - Va). Essa é 
uma derivação alternativa do laplaciano. 
Nota: As derivadas do V da esquerda operam sobre os vetores unitários do V antes da 
multiplicação escalar dos vetores unitários. 


100 
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2.5.3 


2.5.4 


2.5.5 


2.5.6 


2.5.7 


2.5.8 


2.5.9 


Um corpo rígido está em rotação ao redor de um eixo fixo com uma velocidade angular constante 
w. Admita w ao longo do eixo z. Usando coordenadas polares esféricas, 


(a) Calcule 


v=w xr. 


(b) Calcule 
Vxv. 
Resposta: (a) v = Qwrsen 6, 
(b) Vxv=2w. 


O sistema coordenado (x,y,z) é rotacionado através de um ângulo & em sentido anti-horário 
ao redor de um eixo definido pelo vetor unitário n no sistema (x”,%y',z'). Em termos das novas 
coordenadas, o vetor raio se torna 


r'=rcos® +r x nsen ® + n(n- r)(1— cos ®). 


(a) Derive essa expressão partindo de considerações geométricas. 

(b) Mostre que ela se reduz, como esperado, n = Z. A resposta, em forma de matriz, aparece na 
Equação (3.90). 

(c) Verifique que r’? = r?°. 


Resolvas os vetores unitários cartesianos para suas componentes polares esféricas: 


= fsen 6 cos y + Ô cos 0 cos y — Ẹsen q, 


X= 
y = fsen sen y + ÔÊ cos sen p + È cos g, 
2 = îcos 0 — Bsen 0. 


A direção de um vetor é dada pelos ângulos 0, e yı. Para um segundo vetor, os ângulos 
correspondentes são 85 e pa. Mostre que o co-seno do ângulo incluído y é dado por 


cos y = cos 01 cos 0» + sen sen 02 cos(p, — 5). 


Veja Figura 12.15. 


Um certo vetor V não tem nenhuma componente radial. Seu rotacional não tem nenhuma 
componente tangencial. O que isso implica no que se refere à dependência radial das componentes 
tangenciais de V? 


A física moderna dá grande realce à propriedade de paridade — quer uma quantidade permaneça 
invariante ou mude de sinal sob uma inversão do sistema coordenado. Em coordenadas cartesianas 
isso quer dizer x £, Y yez Z: 


(a) Mostre que a inversão (reflexão passando pela origem) de um ponto (r, 0, p) relativa aos eixos 
fixos x, y, z consiste na transformação 


r>r, 0>7-—0, p>ptrT. 


(b) Mostre que £ e œ têm paridade ímpar (reversão de direção) e que Ô tem paridade par. 
Sendo A um vetor qualquer, 
A- Vr=A. 


(a) Verifique esse resultado em coordenadas cartesianas. 
(b) Verifique esse resultado usando coordenadas polares esféricas. (A Equação (2.46) dá V.) 


ELSEVIER 
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2.5.10 


2.5.11 


2.5.12 


2.5.13 


2.5.14 


2.5.15 


2.5.16 


Ache as componentes coordenadas esféricas da velocidade e da aceleração de uma partícula em 
movimento: 


Up= t 

vo = rÒ, 

Vo = rsen dy, 

Gp = Ë — ro” — rsen?09?, 

ag = rÔ + 270 — rsen O cos b’, 

ay = rsen Op + 2rřsen Oy + 2r cos bby. 


Sugestão: 


r(t) = ĉ(t)r(t) 


= [&sen 0(t) cos p(t) + sen 0(t)sen p(t) + 2 cos 0(t)| r(t). 


Nota: Usando as técnicas lagrangianas da Seção 17.3, podemos obter esses resultados de um 
modo mais elegante. O ponto em +, 0, y significa derivada em relação ao tempo, 7 = dr/dt,0 = 
do /dt, p = dy/dt. Newton é que deu origem a essa notação. 

Uma partícula m entra em movimento reagindo a uma força central conforme a segunda lei de 
Newton 


me = ff (r). 
Mostre que r x t = c, uma constante, e que a interpretação geométrica dessa expressão leva à 
segunda lei de Kepler. 
Expresse 0/0x, O/dy, O/0z em coordenadas polares esféricas. 


o o 13 seny ð 
RESP. Se sen cos ps +t cosô cosy- gg 


rsen 0 dp” 


op 2 = sen sen os + cos ĝsen om 2 cosy O 


rsen 0 3g’ 
ð 3 ð ei 20 . 
[LOpt] cos ) — sen 9 
Sugestão: Iguale Vriz e Vro p. 


Pelo Exercício 2.5.12 mostre que 


(0 o .Õ 
il x Srl 
Oy “da dp 
Este é o operador da mecânica quântica correspondente à componente z do momento angular 
orbital. 


Definido o operador do momento angular da mecânica quântica como L = —i(r x V), mostre que 


(8) o 
) = æf | — ) — 
(a) Lz +iLy =€ (5 + icotg0 Z) 


B RO) ð 
ES ; 
(b) Lz — iLy = —e (5 icotgo ão). 


(Esses são os operadores de levantamento e abaixamento da Seção 4.3.) 


Verifique que L x L = iL em coordenadas polares esféricas. L = —i(r x V), o operador de 
momento angular orbital da mecânica quântica. 

Sugestão: Use coordenadas polares esféricas para L mas componentes cartesianas para o produto 
vetorial. 


(a) Pela Equação (2.46) mostre que 


102 
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2.5.17 


2.5.18 


2.5.19 


2.5.20 


2.5.21 


2.5.22 


(b) Resolva Ô e para componentes cartesianas e determine Ly, Ly e L, em termos de 0, y e suas 
derivadas. 
(c) Por L? = L2 + Lj + L2, mostre que 


1 ə o 1 8? 
2— 
dia sen 0 90 (sen 035) sen?0 dp? 


ð f8) 
pad O A 
RA +51 >): 


Esta última identidade é útil para relacionar o momento angular orbital e a equação diferencial de 
Legendre, Exercício 9.3.8. 


Sendo L = —ir x V, verifique as identidades de operador 
o rx L, 


(a) vefs i 73 


(b) me co(1+r2) =iV xL. 
T 


Mostre que as três formas seguintes (coordenadas esféricas) de V?y(r) são equivalentes: 


HO), if PU) | 2de) 


(a) un Ga 


r2 stle 


A segunda forma é particularmente conveniente para estabelecer a correspondência entre as 
descrições polares esféricas e as descrições cartesianas de um problema. 


Um modelo da coroa solar admite que a equação de estado estável de fluxo de calor, 
V(kVT)=0, 


é satisfeita. Aqui, k, a condutividade térmica é proporcional a T5/2. Admitindo que a temperatura 
T é proporcional a r”, mostre que a equação de fluxo de calor é satisfeita por T = To(ro/ r)?/ gi 


Um certo campo de força é dado por 


2Pcosð 4P 
F=+" 2", Â sen 0, r > P/2 
r r 


(em coordenadas polares esféricas). 


(a) Examine V x F para ver se existe um potencial. 

(b) Calcule $ F - dA para um círculo unitário no plano 0 = 7/2. O que isso indica em relação à 
força ser conservativa ou não-conservativa? 

(c) Se você acredita que F pode ser descrita por F = —V«), ache q). Caso contrário, afirme, 
simplesmente, que não existe nenhum potencial aceitável. 

(a) Mostre que A = —Ẹcotg0 /r é uma solução de V x A = ĉ/r°. 

(b) Mostre que essa solução em coordenadas polares esféricas está de acordo com a solução dada 


para o Exercício 1.13.6: 
az 


AE y 
=X . 
r(x? +y?) Yra +y?) 


Note que a solução diverge para O = 0, 7 correspondendo a x, y = 0. 
(c) Por fim, mostre que A = —Oysen 8/r é uma solução. Note que, embora esta solução não 
divirja (r 0), ela não é mais de valor único para todos os possíveis ângulos azimutais. 


Um potencial vetor magnético é dado por 


- Hom xr, 
-4r r3 


Mostre que isso leva à indução magnética B de um dipolo magnético pontual com momento dipolar 
m. 
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RESP. param = tm, 
~ Uo Ímcos0 à ugo msen O 
VxA = fî% +0!0 
417 r3 47 r 


Compare com as Equações (12.133) e (12.134) 
2.5.23 Quando as distâncias em relação à fonte são grandes, a radiação dipolar elétrica tem campos 


e (kr—uwt) 5 e (kr—wt) J 


E = a gsen 0—0, B = agsen 0—————— ò. 
r r 


Mostre que as equações de Maxwell 


oB oE 
ni e V x B = copo -5r 


são satisfeitas se tomarmos a 
E 


w 
aB k 
Sugestão: Uma vez que r é grande, termos de ordem r7? podem ser descartados. 


2.5.24 O potencial vetor magnético para uma casca esférica girante uniformemente carregada é 


~ Hoafow sen O 


A= 3 r2 


~ HoaTw 


j r>a 


-rcos0, r<a. 


(a = raio da casca esférica, o = densidade superficial de carga e w = velocidade angular). Ache a 
indução magnética B = V x A. 
2ugatow cos0 


RESP. B,(r,0) = — é r>a, 
3 rê 
E 0 
Boro) = PEIEE, r>a 
2 
B = pT, r<a. 


2.5.25 (a) Explique por que V’? em coordenadas polares planas resulta de V? em coordenadas cilíndricas 
circulares com z = constante. 
(b) Explique por que usar V? em coordenadas polares esféricas e restringir 0 a 7 /2 não leva à 
forma polar plana de V. 
Nota: 
ə? 19 1 8 


2 — 
V (p,p) o a 


2.6 Análise Tensorial 


Introdução, Definições 

Tensores são importantes em muitas áreas da física, incluindo relatividade geral e eletrodinâmica. Escalares e 
vetores são casos especiais de tensores. No Capítulo 1, uma quantidade que não mudava sob rotações do sistema 
de coordenadas em um espaço tridimensional, uma invariante, era denominada escalar. Um escalar é especificado 
por um número real e é um tensor de ordem 0. Uma quantidade cujas componentes se transformavam sob rotações 
como as da distância de um ponto a partir de uma origem escolhida (Equação (1.9), Seção 1.2) era denominada 
vetor. A transformação das componentes do vetor sob uma rotação das coordenadas preserva o vetor como uma 
entidade geométrica (tal como uma seta no espaço), independentemente da orientação da estrutura de referência. 
Em um espaço tridimensional, um vetor é especificado por 3 = 3! números reais, por exemplo, suas componentes 
cartesianas, e é um tensor de ordem 1. Um tensor de ordem n tem 3” componentes que se transformam de 
uma maneira definida. Essa filosofia de transformação é de crucial importância para a análise tensorial e obedece 
ao conceito de vetor e de espaço vetorial (ou linear) dos matemáticos e à noção dos físicos de que observáveis 
físicos não dependem da escolha de estruturas coordenadas. Há uma base física para tal filosofia: descrevemos o 


“Em um espaço N dimensional, um tensor de ordem n tem N” componentes. 
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mundo físico pela matemática, mas quaisquer previsões físicas que fazemos devem ser independentes de nossas 
convenções matemáticas, tal como um sistema de coordenadas com sua origem arbitrária e orientação de seus 
eixos. 

Há uma possível ambigiiidade na lei de transformação de um vetor 


A; = É aijA;, (2.59) 
j 


na qual a;; é o co-seno do ângulo entre o eixo x/ e o eixo £j. Se partirmos de um vetor distância diferencial dr, 
então, tomando dx! como uma função das variáveis “sem linha”, 


de; =X e (2.60) 
AE r Og; J i 
por diferenciação parcial. Se estabelecermos 
Og, 
= 55 (2.61) 
J 


as Equações (2.59) e (2.60) são consistentes. Qualquer conjunto de quantidades AŻ, transformando-se de acordo 
com 


| əx. 
A= Ee no (2.624) 
J 


é definido como um vetor contravariante cujos índices escrevemos como índices superiores (sobrescritos); isso 
inclui o vetor de coordenadas cartesianas zê = x; de agora em diante. 

Contudo, já encontramos um tipo ligeiramente diferente de transformação vetorial. O gradiente de um escalar 
Vo, definido por 


Vo= + t os (2.63) 
usando x1, x2, x? para x, y, z, se transforma em 
dy! dy dx) 
Dari 2 Dai dar ea 


usando q = (x,y,z) = p(x',y',2') = y', p definido como uma quantidade escalar. Note que isso é diferente 
da Equação (2.62) considerando que temos dx? /0x'* em vez de ðx't/Əxİ. A Equação (2.64) é tomada como a 
definição de um vetor covariante com o gradiente como protótipo. O covariante análogo da Equação (2.62a) é 


Ox) 
A= ami Aj. (2.62b) 
j 
Somente em coordenadas cartesianas é 
Ox) Ox" 


de modo que não há nenhuma diferença entre transformações contravariantes e covariantes. Em outros sistemas, a 
Equação (2.65) em geral não se aplica, e a distinção entre contravariante e covariante é real e deve ser observada. 
Isso é de extrema importância no espaço riemanniano curvo da relatividade geral. 

No restante desta seção as componentes de qualquer vetor contravariante são denotadas por um índice 
superior (sobrescrito), Aº, enquanto um índice inferior (subscrito) é usado para as componentes de um vetor 
covariante 4,. 


óIsso significa que as coordenadas (x,y,z) são escritas (x1, £2, x3), uma vez que r se transforma em um vetor contravariante. A 
ambigiiidade de ter x? representando x ao quadrado e também y é o preço que pagamos. 
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Definição de Tensores de Ordem 2 
Agora passamos a definir tensores contravariantes, mistos e covariantes de ordem 2 pelas seguintes equações 
para suas componentes sob transformações de coordenadas: 


MJ 

A Ox da! : 
kl 

ðx'İ O! 

ão k 
B’; ark pyi É V (2.66) 

dx" da! 
Ci; = Ox'i ðx' i kl 


É claro que a ordem segue o número de derivadas parciais (ou co-senos direcionais) na definição: 0 para um escalar, 
1 para um vetor, 2 para um tensor de ordem 2, e assim por diante. Cada índice (superior ou inferior) abrange o 
número de dimensões do espaço. O número de índices (igual à ordem do tensor) é independente das dimensões do 
espaço. Vemos que 4*! é contravariante em relação a ambos os índices, Cp; é covariante em relação a ambos os 
índices e B*, se transforma de modo contravariante em relação ao primeiro índice k, mas de modo covariante em 
relação ao segundo índice l. Mais uma vez, se estivermos usando coordenadas cartesianas, todas as três formas dos 
tensores contravariantes, mistos e covariantes de segunda ordem são as mesmas. 

Assim como as componentes de um vetor, as leis de transformação para as componentes de um tensor, Equação 
(2.66), resultam em entidades (e propriedades) que são independentes da escolha da estrutura de referência. É 
isso que torna a análise tensorial importante em física. A independência em relação à estrutura de referência 
(invariância) é ideal para expressar e investigar leis físicas universais. 

O tensor de segunda ordem A (componentes 4*!) pode ser convenientemente representado escrevendo suas 
componentes em um arranjo quadrado (3 x 3, se estivermos em espaço tridimensional): 


AM A! A! 
A= [| A% 42 4238 |. (2.67) 
A A A33 


Isso não significa que qualquer arranjo quadrado de números ou funções forme um tensor. A condição essencial é 
que as componentes se transformem segundo a Equação (2.66). 

No contexto da análise matricial, as equações de transformação precedentes tornam-se (para coordenadas 
cartesianas) uma transformação de similaridade ortogonal; veja a Seção 3.3. Na Seção 3.5 desenvolvemos uma 
interpretação geométrica de um tensor de segunda ordem (tensor de inércia). 

Resumindo, tensores são sistemas de componentes organizados por um ou mais índices que se transformam 
de acordo com regras especificas sob um conjunto de transformações. O número de índices é denominado ordem 
do tensor. Se as transformações forem rotações de coordenadas em um espaço tridimensional, então a análise 
tensorial equivale ao que fizemos nas seções sobre coordenadas curvilíneas e coordenadas cartesianas no Capítulo 
1. Nas quatro dimensões do espaço-tempo de Minkowski, as transformações são transformações de Lorentz, e 
tensores de ordem 1 são denominados quadrivetores. 


Adição e Subtração de Tensores 


A adição e a subtração de tensores são definidas em termos dos elementos individuais, exatamente como para 
vetores. Se 
A+B=C, (2.68) 


então 
A” + B = 0”. 


E claro que A e B devem ser tensores da mesma ordem e ambos expressos em espaço com o mesmo número de 
dimensões. 


Convenção de Soma 


Em análise tensorial costuma-se adotar uma convenção para a soma, que é colocar a Equação (2.66) e as equações 
tensoriais subsequentes sob uma forma mais compacta. Contanto que estejamos distinguindo entre contravariância 
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e covariância, vamos concordar que, quando um índice aparecer de um lado de uma equação, uma vez como 
índice superior e outra vez como índice inferior (exceto para as coordenadas em que ambos são índices inferiores), 
automaticamente somamos sobre aquele índice. Então podemos escrever a segunda expressão na Equação (2.66) 
como 
dr Ox! y 
Dat Dw” b 
subentendendo-se que a soma do lado direito é executada sobre k e l. Essa é a convenção da soma de Einstein.” O 
índice i é superior porque está associado com o contravariante x! *; da mesma forma, j é um índice inferior porque 
está relacionado com o gradiente covariante. 

Para ilustrar a utilização da convenção da soma e algumas das técnicas de análise tensorial, vamos mostrar que 
o nosso conhecido delta de Kronecker, 61, é na realidade um tensor misto de ordem 2, 08,8 A questão é: 0" 1 se 
transforma de acordo com a Equação (2.66)? Este é nosso critério para chamá-lo de tensor. Usando a convenção 
de soma, temos, 


Bos (2.69) 


ðx'İ Ox! ðx'İ Dar 
k Ra 
"dar dali Dar dad eso) 


ô 
pela definição do delta de Kronecker. Agora, 


dg Out. gut 
ðxk ðx'İ Os” 


(2.71) 


por diferenciação parcial do lado direito (regra da cadeia). Contudo, x" e x'? são coordenadas independentes e, 
por conseguinte, a variação de uma delas em relação à outra deve ser zero se elas forem diferentes, unidade ou 
coincidirem; isto é, 

Fo jè 


ma (2.72) 


Por conseqüência, 
ðx'’ dx! k 
O Oak gas * 


mostrando que os ĝ *, são, de fato, as componentes de um tensor misto de segunda ordem. Note que esse resultado 
é independente do número de dimensões de nosso espaço. A razão para o índice superior i e o índice inferior j é a 
mesma que na Equação (2.69). O delta de Kronecker tem mais uma propriedade interessante. Ele tem as mesmas 
componentes em todos os nossos sistemas coordenados rotacionados e, portanto, é denominado isotrópico. Na 
Seção 2.9 encontraremos um tensor isotrópico de terceira ordem e três tensores isotrópicos de quarta ordem. Não 
existe nenhum tensor (vetor) isotrópico de primeira ordem. 


li 
ô j 


Simetria — Anti-simetria 


A ordem na qual os índices aparecem em nossa descrição de um tensor é importante. Em geral, A™” é independente 
de A"”, mas há alguns casos de especial interesse. Se, para todos m e n, 


Aut A (2.73) 
denominamos o tensor simétrico. Se, por outro lado, 
ATE == AT (2.74) 


o tensor é anti-simétrico. É claro que todo tensor (de segunda ordem) pode ser decomposto em partes simétrica e 
anti-simétrica pela identidade 


sendo o primeiro termo à direita um tensor simétrico e o segundo um tensor anti-simétrico. Uma decomposição 
similar de funções em partes simétrica e anti-simétrica é de extrema importância em mecânica quântica. 


7Neste contexto, seria melhor escrever dx! t /0x" como a. e dx! /ðx'İ como b}. 
$Na prática é comum nos referirmos a um tensor como A especificando uma componente típica, A; j- Contanto que o leitor evite escrever 


absurdos como A = A;;, não há mal nenhum. 
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Espinores 


Houve época em que se pensava que o sistema de escalares, vetores, tensores (segunda ordem), e assim por 
diante, formava um sistema matemático completo, um sistema adequado para descrever uma física independente 
da escolha de estrutura de referência. Mas o universo e a física matemática não são tão simples assim. No reino 
das partículas elementares, por exemplo, partículas de spin zero? (mésons 7, partículas œ) podem ser descritas com 
escalares, partículas de spin 1 (dêuterons) por vetores e partículas de spin 2 (grávitons) por tensores. Essa listagem 
omite as partículas mais comuns: elétrons, prótons e nêutrons, todas com spin >. Elas são adequadamente descritas 
por espinores. Um espinor não é um escalar, vetor ou tensor. Uma breve introdução aos espinores no contexto da 
teoria de grupo (J = 1/2) aparece na Seção 4.3. 


Exercícios 
2.6.1 Mostre que, se todas as componentes de qualquer tensor de qualquer ordem se anulam em um 
determinado sistema coordenado particular, elas se anulam em qualquer sistema de coordenadas. 
Nota: Esta questão adquire especial importância no espaço quadridimensional curvo da relatividade 
geral. Se uma quantidade, expressa como um tensor, existir em um sistema de coordenadas, ela 
existirá em todos os sistemas de coordenadas e não é apenas uma conseqiiência da escolha de um 
sistema de coordenadas (como são as forças centrífugas e de Coriolis em mecânica newtoniana). 


2.6.2 As componentes do tensor À são iguais às componentes correspondentes do tensor B em um 
determinado sistema de coordenadas, denotado pelo índice superior 0; isto é, 


O — p0 
AS, = B}. 


Mostre que aquele tensor A é igual ao tensor B, 4;; = Bij, em todos os sistemas de coordenadas. 


2.6.3 As últimas três componentes de um vetor quadridimensional se anulam em cada um de dois ssitemas 
de referência. Se o segundo sistema de referência não for uma mera rotação do primeiro ao redor do 
eixo xo, isto é, se ao menos um dos coeficientes a;o (i = 1,2,3) 0, mostre que a componente de 
ordem zero se anula em todos os sistemas de referência. Traduzindo para mecânica relativista, isso 
significa que, se o momento for conservado em dois referenciais de Lorentz, então a energia será 
conservada em todos os referenciais de Lorentz. 

2.6.4 Pela análise do comportamento de um tensor geral de segunda ordem sob rotações de 90º e 180º ao 
redor dos eixos de coordenadas, mostre que um tensor isotrópico de segunda ordem em um espaço 
tridimensional deve ser um múltiplo de ó;;. 


2.6.5 O tensor de curvatura quadridimensional de quarta ordem de Riemann-Christoffel da relatividade 
geral, Rikim» Satisfaz as relações de simetria 


Rixim = —Rikmi = —Rkilm- 


Com índices variando de O a 3, mostre que o número de componentes independentes é reduzido de 
256 a 36 e que a condição 
Rikim = Rimik 

reduz ainda mais o número de componentes independentes para 21. Por fim, se as componentes 

satisfizerem uma identidade Rikxim + Riimk + Rimkı = 0, mostre que o número de componentes 

independentes é reduzido para 20. 

Nota: A identidade final, de três termos, fornece novas informações somente se todos os quatro 

índices forem diferentes. Então, ela reduz de um terço o número de componentes independentes. 
2.6.6 Tikimé anti-simétrico em relação a todos os pares de índices. Quantas componentes independentes 

ele tem (em um espaço tridimensional)? 


2.7 Contração, Produto Direto 


Contração 
Quando tratamos de vetores, formamos um produto escalar (Seção 1.3) somando produtos de componentes 


correspondentes: 
A.B=4,B; (convenção de soma). (2.76) 


9O spin de partículas é o momento angular intrínseco (em unidades de ñ). É distinto do momento angular orbital clássico devido ao 
movimento. 
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A generalização dessa expressão em análise tensorial é um processo conhecido como contração. Dois índices, um 

covariante e o outro contravariante, são igualados um ao outro, e então (como subentendido pela convenção de 

soma) somamos sobre esse índice repetido. Por exemplo, vamos contrair o tensor misto de segunda ordem B”*,, 
Ox Ox!» Og 


Pi aeb E k 
B'*,= E dr p= Jrk P l (2.77) 


usando a Equação (2.71) e, então, pela Equação (2.72), 


B'º',= d'p B" = By. (2.78) 


Nosso tensor misto de segunda ordem contraído é invariante e, por conseguinte, um escalar. !º Isso é exatamente o 
que obtivemos na Seção 1.3 para o produto escalar de dois vetores e na Seção 1.7 para a divergência de um vetor. 
Em geral, a operação de contração reduz em 2 a ordem de um tensor. Um exemplo da utilização da contração 
aparece no Capítulo 4. 


Produto Direto 

As componentes de um vetor covariante (tensor de primeira ordem) a; e e as de um vetor contravariante (tensor 
de primeira ordem) bf podem ser multiplicadas componente por componente para dar o termo geral a;b. Essa 
operação, pela Equação (2.66), é na verdade um tensor de segunda ordem porque 


- Out Ori, Oxt Og') i 
ab! = mad = Doi dai (Mb). (2.79) 
Contraindo, obtemos 
ab” = apb", (2.80) 


como nas Equações (2.77) e (2.78), para dar o produto escalar regular. 

Para o caso de dois vetores, o produto direto é um tensor de segunda ordem. Nesse sentido, podemos atribuir 
significado a VE, que não foi definido dentro da estrutura da análise vetorial. Em geral, o produto direto de dois 
tensores é um tensor de ordem igual à soma das duas ordens iniciais, isto é, 


ABM 2 cirt, (2.81a) 
em que C’ ge é um tensor de quarta ordem. Pelas Equações (2.66), 


nig Va Ox Ox" 
Cós = Cr. (2.81b) 
da” Ox!) dxP OxI 

O produto direto é uma técnica para criar novos tensores, de ordens mais altas. O Exercício 2.7.1 é uma 
forma do produto direto na qual o primeiro fator é V. Aplicações aparecem na Seção 4.6. 

Quando T é um tensor cartesiano de enésima ordem, (0/0')T;k1 -.. , uma componente de VT, é um tensor 
cartesiano de ordem n + 1 (Exercício 2.7.1). Contudo, (0/0x')T;x . . . não é um tensor em espaços mais gerais. 
Em sistemas não-cartesianos, O/0x' “agirá sobre as derivadas parciais dx? /0x' 4 e destruirá a simples relação de 
transformação de tensor (veja a Equação (2.129)). 

Até aqui, a distinção entre uma transformação covariante e uma transformação contravariante foi mantida 
porque ela não existe em um espaço não-euclidiano e porque é de grande importância na relatividade geral. 
Nas Seções 2.10 e 2.11 desenvolveremos relações diferenciais para tensores gerais. Entretanto, por causa da 
simplificação conseguida, muitas vezes nos restringimos a tensores cartesianos. Como observamos na Seção 2.6, a 
distinção entre contravariância e covariância desaparece. 


Exercícios 
2.71 Se T...; é um tensor de ordem n, mostre que OT...;/ Ox) é um tensor de ordem n + 1 (coordenadas 
cartesianas). 
Nota: Em sistemas de coordenadas não-cartesianas os coeficientes a;; são, em geral, funções das 
coordenadas, e a derivada simples de um tensor de ordem n não é um tensor exceto no caso especial 


de n = 0. Neste caso, a derivada realmente resulta em um vetor covariante (tensor de ordem 1) pela 
Equação (2.64). 


10Em análise matricial, este escalar é o traço da matriz, Seção 3.2. 
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2.7.2 Se Tijk.. é um tensor de ordem n, mostre que »; Tijk- [ƏLİ é um tensor de ordem n — 1 
(coordenadas cartesianas). 
2.7.3 O operador 
z 1 8 
“20 
pode ser escrito como 
192 


29) 
x4 
LO $ 


usando x4 = tct. Este é o laplaciano quadridimensional, às vezes denominado o ď’alembertiano e 


denotado por []2. Mostre que ele é um operador escalar, ou seja, é invariante sob transformações 
de Lorentz. 


2.8 Regra do Quociente 


Se A; e B; são vetores, como vimos na Seção 2.7, é fácil mostrar que A;B; é um tensor de segunda ordem. Aqui, 
estamos preocupados com uma variedade de relações inversas. Considere equações como 


RA =B (2.824) 
KAB (2.82b) 
EA Bi (2.820) 
Kin Ai; = Bri (2.82d) 
KAS bae (2.82e) 


De acordo com nossa restrição a sistemas cartesianos, escrevemos todos os índices como índices inferiores e, a 
menos que outra coisa seja especificada, índices de soma repetidos. 

Em cada uma dessas expressões, A e B são tensores conhecidos de ordem indicada pelo número de índices 
e A é arbitrário. Em cada caso, K é uma quantidade desconhecida. Desejamos estabelecer as propriedades de 
transformação de K. A regra do quociente afirma que, se a Equação de interesse for válida em todos os sistemas 
de coordenadas cartesianas (rotacionadas), K é um tensor da ordem indicada. A importância, na teoria da física, é 
que a regra do quociente pode estabelecer a natureza tensorial das quantidades. O Exercício 2.8.1 é uma ilustração 
simples disso. A regra do quociente (Equação (2.82b)) mostra que a matriz de inércia que aparece na equação do 
momento angular L = Iw, Seção 3.5, é um tensor. 

Ao provar a regra do quociente, consideramos a Equação (2.82b) um caso típico. Em nosso sistema de 
coordenadas “linha”, 

K;ij 4; = B; = QikBk, (2.83) 


usando as propriedades de transformação vetorial de B. Uma vez que a equação é válida em todos os sistemas de 
coordenadas cartesianas rotacionadas, 
air Bk = aik(KriAı). (2.84) 


Agora, transformando A volta para o sistema de coordenadas “linha”!! (compare com a Equação (2.62)), temos 


KA, = aik Kpiajı A}. (2.85) 


A a 


Rearranjando, obtemos 
(Ki; = Gira Ka) A; = 0. (2.86) 


ij 
Isso deve ser válido para cada valor do índice ¿ e para cada sistema de coordenadas “linha”. Visto que As é 


arbitrário, ! concluímos que 
t 
K; 


j = kaj Kkl, (2.87) 


Note a ordem dos índices do co-seno direcional aj, nesta transformação inversa. Temos 


Oz 4 1 
N OG 
j J j 


12Poderíamos, por exemplo, tomar A = le Al, = 0 para m Æ 1. Então, a Equação K’; = aikai Ky resultaria imediatamente. O 
restante da Equação (2.87) vem de outras escolhas especiais do A; arbitrário. 
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que é a nossa definição de tensor de segunda ordem. 

As outras equações podem ser tratadas de modo semelhante, dando origem à outras formas da regra do 
quociente. Devemos observar uma pequena armadilha: a regra do quociente não se aplica necessariamente se 
B for zero. As propriedades de transformação de zero são indeterminadas. 


Exemplo 2.8.1 EQUAÇÕES DE MOVIMENTO E EQUAÇÕES DE CAMPO 
Em mecânica clássica, as equações de movimento de Newton my = F nos dizem, com base na regra do quociente, 
que, se a massa é um escalar e a força um vetor, então a aceleração a = v é um vetor. Em outras palavras, o caráter 
de vetor da força como o termo essencial impõe seu caráter de vetor sobre a aceleração, contanto que o fator de 
escala m seja escalar. 

A equação de onda da eletrodinâmica 924 = J” envolve a versão quadridimensional do laplaciano 6? = 
As — V2, um escalar de Lorentz, e a corrente quadrivetorial externa J” como seu termo essencial. Pela regra do 
quociente, inferimos que o potencial vetorial A” também é quadrivetorial. Se a corrente essencial é um quadrivetor, 


o potencial vetorial deve ser de ordem 1 pela regra do quociente. 


E 
A regra do quociente é uma substituta para a divisão ilegal de vetores. 
Exercícios 
2.8.1 O somatório duplo K;; A;B; é invariante para quaisquer dois vetores A; e B;. Prove que K;; é um 


tensor de segunda ordem. 
Nota: Na forma ds? (invariante) = gij dx” dx’, este resultado mostra que a matriz g;j é um tensor. 


2.8.2 A Equação K,;A;; = Bip é válida para todas as orientações do sistema de coordenadas. Se A e B 
são tensores arbitrários de segunda ordem, mostre que K também é um tensor de segunda ordem. 


2.8.3 A exponencial em uma onda plana é exp[i(k - r — wt)]. Reconhecemos x” = (ct, £1, 12,13) como 
um vetor protótipo em um espaço de Minkowski. Se k - r — wt é um escalar sob transformações de 
Lorentz (Seção 4.5), mostre que k” = (w/c, kı, k2, k3) é um vetor em um espaço de Minkowski. 
Nota: A multiplicação por A leva a (E /c, p) como um vetor em um espaço de Minkowski. 


2.9 Pseudotensores, Tensores Duais 


Até aqui nossas transformações de coordenadas se restringiram às rotações passivas puras. Agora consideramos o 
efeito de reflexões ou inversões. 


Figura 2.9: Inversão de coordenadas cartesianas — vetor polar. 


Se tivermos coeficientes de transformação a;; = —0;;, então, pela Equação (2.60), 
q! = —g" (2.88) 


que é uma inversão ou transformação de paridade. Note que essa transformação muda nosso sistema de 
coordenadas inicial dextrogiro em um sistema de coordenadas levogiro.!? Nosso vetor protótipo r com 


componentes (x1, 72, x’) se transforma em 


r = (242,28) = (-x!,-x2, 2º). 


BEsta é uma inversão do sistema de coordenadas ou dos eixos coordenados; objetos no mundo físico permanecem fixos. 
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Esse novo vetor r’ tem componentes negativas em relação ao novo conjunto transformado de eixos. Como mostra 
a Figura 2.9, inverter as direções dos eixos coordenados e inverter os sinais das componentes resulta em r’ = r. 
O vetor (uma seta no espaço) fica exatamente como era antes da execução da transformação. O vetor posição r 
e todos os outros vetores cujas componentes se comportam dessa maneira (invertendo o sinal com a inversão dos 
eixos coordenados) são denominados vetores polares e têm paridade ímpar. 

Uma diferença fundamental aparece quando encontramos um vetor definido como o produto externo de dois 
vetores polares. Seja C = A x B, em que ambos, A e B, são vetores polares. Pela Equação (1.33), as componentes 
de C são dadas por 


C! = A2Bº — A B? , (2.89) 


e assim por diante. Agora, quando os eixos coordenados são invertidos, AS A", Bj > -B;, mas, por sua 
definição, C: — +C'; isto é, nosso vetor produto externo, vetor C, não se comporta como um vetor polar 
sob inversão. Para distinguir, nós o rotulamos como um pseudovetor ou vetor axial (veja a Figura 2.10)) que tem 
paridade par. O termo vetor axial é freqüentemente usado porque esses produtos externos costumam aparecer a 
partir de uma descrição de rotação. 


c 


Figura 2.10: Inversão das coordenadas cartesianas — vetor axial. 


Eis alguns exemplos: 


velocidade angular V=WXT, 
momento angular orbital L=rxp, 
torque, força = F, N=rxF, 
campo de indução magnética B, E =-V xE. 


Em v = w x r, o vetor axial é a velocidade angular w, e r e v = dr/ dt são vetores polares. É claro que vetores 
axiais ocorrem com freqüência em física, embora, em geral, esse fato não seja destacado. Em um sistema de 
coordenadas dextrogiro, um vetor axial C tem um sentido de rotação associado a ele dado por uma regra da mão 
direita (compare com a Seção 1.4). No sistema invertido, levogiro, o sentido de rotação é para o lado esquerdo, o 
que é indicado pelas setas curvas na Figura 2.10. 

A distinção entre vetores polares e axiais também pode ser ilustrada por uma reflexão. Um vetor polar se reflete 
em um espelho como uma seta física real, Figura 2.11a. Nas Figuras 2.9 e 2.10 as coordenadas são invertidas; 
o mundo físico continua fixo. Aqui, os eixos coordenados permanecem fixos; o mundo é refletido, como em um 
espelho no plano zz. Especificamente nessa representação, mantemos os eixos fixos e associamos uma troca de 
sinal com a componente do vetor. Para um espelho no plano xz, P} — —P,. Temos 


P=(P,,P,,P.) 
P=(Ps;-PP:) vetor polar. 

Um vetor axial, tal como um campo magnético H ou um momento magnético u (= corrente x área do circuito 
de corrente) comporta-se de maneira bem diferente sob reflexão. Considere o campo magnético H e o momento 
magnético u que serão produzidos por uma carga elétrica que se movimenta por uma trajetória circular (Exercício 
5.8.4 e Exemplo 12.5.3). A reflexão inverte o sentido de rotação da carga. 
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Figura 2.11: (a) Espelho no plano zxz; (b) espelho no plano zz. 


Os dois circuitos fechados de corrente e os momentos magnéticos resultantes são mostrados na Figura 2.11b. 
Temos 


H = (Hs, Hy Hz) 
HW' = (=p, Hy,—Hz) vetor axial refletido. 

Se concordamos que o universo não se importa se usamos um sistema coordenado dextrogiro ou levogiro, 
então não tem sentido adicionar um vetor axial a um vetor polar. Na Equação vetorial A = B, A e B são ou 
vetores polares ou vetores axiais.!! Restrições semelhantes se aplicam a escalares e pseudotensores e, em geral, 
aos tensores e pseudotensores considerados a seguir. 

Em geral, pseudo-escalares, pseudovetores e pseudotensores se transformarão em 


Ss = JS, C; = Ja;jC;, Aij = Japa; Aki, (2.90) 


em que J é o determinante!” do arranjo de coeficientes a&mn, O jacobiano da transformação de paridade. Em nossa 
inversão, o jacobiano é 


-1 0 0 
J=| 0 -1 0 |=-l1. (2.91) 
0 0 — 
Para uma reflexão de um eixo, o eixo x, 
-1 0 0 
J=| 0 1 0/=+1, (2.92) 
0 0 1 
e, mais uma vez, o jacobiano J = —1. Por outro lado, para todas as rotações puras, o jacobiano J é sempre +1. 


Matrizes de rotação são discutidas com mais detalhes na Seção 3.3. 
No Capítulo 1 mostramos que o produto escalar triplo S = A x B-C é um escalar (sob rotações). Agora, 
considerando a transformação de paridade dada pela Equação (2.88), vemos que S — — S, provando que o produto 


14A grande exceção a essa regra está no decaimento beta, nas interações fracas. Neste caso, o universo distingue entre sistemas dextrogiros 
e levogiro e adicionamos interações vetoriais polares e axiais. 
Determinantes são descritos na Seção 3.1. 
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escalar triplo é, na verdade, um pseudo-escalar: esse comportamento foi prenunciado pela analogia geométrica 
de um volume. Se todos os três parâmetros de volume — comprimento, profundidade e altura — mudarem de 
distâncias positivas para distâncias negativas, o produto dos três será negativo. 


Símbolo de Levi-Civita 
Para utilização futura é conveniente introduzir o símbolo tridimensional de Levi-Civita c;;x., definido por 


E123 =€231 = €312 = 1, 
E132 = €213 5 E321 = — 1, (2.93) 


todos os outros Eijk = O. 


Note que c;; é anti-simétrico em relação a todos os pares de índices. Agora suponha que temos um pseudotensor 
de terceira ordem que, em um determinado sistema de coordenadas, é igual a ijk, Eijk. Então, 


$ 
ije = lala;pa;gUkrEpar (2.94) 
pela definição de pseudotensor. Agora, 
a1paā2q43rEpqr = la| (2.95) 
por expansão direta do determinante, mostrando que ôjos = |a|? = 1 = £123. Considerando as outras 
possibilidades uma por uma, encontramos 
Oijk — Eijk (2.96) 


para rotações e reflexões. Por conseguinte, c;;; é um pseudotensor.!º,17 Além do mais, ele é visto como um 
pseudotensor isotrópico com as mesmas componentes em todos os sistemas coordenados cartesianos. 


Tensores duais 
Podemos associar qualquer tensor anti-simétrico de segunda ordem C (em um espaço tridimensional) um 


pseudovetor dual C; definido por 


1 ; 
C;= zearo. (2.97) 


Aqui, o anti-simétrico C pode ser escrito como 


0 C12 — C31 
C= —ct 0 O ; (2.98) 
CS! — C23 0 


Sabemos que C; deve se transformar em um vetor sob rotações a partir da dupla contração do (pseudo) tensor 
de quinta ordem c;; mn, mas que, na verdade, ele é um pseudovetor pela natureza de c;;,.. Especificamente, as 
componentes de C são dadas por 

(C1, C2, C3) = (0, 0t, 0”). (2.99) 


Note a ordem cíclica dos índices que resulta da ordem cíclica das componentes de £;jķ. A Equação (2.99) significa 
que nosso produto vetorial tridimensional pode ser literalmente tomado como um pseudovetor ou um tensor anti- 
simétrico de segunda ordem, dependendo de como preferirmos escrevê-lo. 

Se tomarmos três vetores (polares) A, B e C, podemos definir o produto direto 


yik = A'Bict. (2.100) 


Por uma extensão da análise da Seção (2.6), Vti% é um tensor de terceira ordem. A quantidade dual 


1 a 
k 
V = envio (2.101) 
16A utilidade de €pqr vai muito além desta seção. Por exemplo, as matrizes My do Exercício 3.2.16 são derivadas de (M,)pa = —iEpar. 


Grande parte da análise vetorial elementar pode ser escrita sob uma forma muito compacta usando c;;;. e a identidade do Exercício 2.9.4. Veja 
A. A. Evett, “Permutation symbol approach to elementary vector analysis”. Am. J. Phys. 34: 503 (1966). 
170 valor numérico de Epar é dado pelo produto escalar triplo de vetores unitários de coordenadas: 


Xp: Xq X Xr. 


Deste ponto de vista, cada elemento de epgr é um pseudo-escalar, mas os epgr formam, coletivamente, um pseudotensor de terceiro grau. 


“livro” — 2007/8/1 — 15:06 — page 114 — #124 


114 Física Matemática Arfken e Weber ELSEVIER 


é claramente um pseudo-escalar. Por expansão, verificamos que 


A! B! Ot 
V=| Æ B €º (2.102) 
A B8 œ 


é nosso familiar produto escalar triplo. 

Para utilização na escrita das equações de Maxwell em forma covariante, Seção 4.6, é interessante estender 
essa análise vetorial dual para espaço quadridimensional e, em particular, indicar que o elemento de volume 
quadridimensonal dx? dx! dx? dx? é um pseudo-escalar. 

Introduzios o símbolo de Levi-Civita c;;;j, O análogo quadridimensional de c;;;. Essa quantidade c;;k 
é definida como totalmente anti-simétrica em todos os quatro índices. Se (ijkl) for uma permutação 
par!8 de (0, 1, 2, 3), então Eijk] é definido como +1; se for uma permutação ímpar, então Eijk; é —1, e é O 
se quaisquer dois índices forem iguais. Pode-se provar que o c;;k1 de Levi-Civita é um pseudotensor de ordem 
4 por análise semelhante à usada para determinar a natureza de tensor de c;;y. Introduzindo o produto direto de 
quatro vetores como tensor de quarta ordem com componentes 


Hit = A'BÍIC*D!, (2.103) 
construídas a partir dos vetores polares A, B, C e D, podemos definir a quantidade dual 


1 o 
H= qeumve, (2.104) 


um pseudo-escalar por causa da quádrupla contração com o pseudotensor c;;x1. Agora, sejam A, B, Ce D 
deslocamentos infinitesimais ao longo dos quatro eixos coordenados (espaço de Minkowski), 


A = (daº,0,0,0) 
(2.105) 
B = (0,dzt,0,0), e assim por diante, 
e 
H = dr? da! de? dz’. (2.106) 


O elemento de volume quadridimensional agora é identificado como um pseudo-escalar. Usamos esse resultado 
na Seção 4.6. Esse resultado podia ser esperado dos resultados da teoria especial da relatividade. A contração de 
Lorentz-Fitzgerald de dx! dx? dx? apenas equilibra a dilatação do tempo de dz?. 

Entramos nesse espaço quadridimensional como uma simples extensão matemática do espaço tridimensional e, 
na verdade, poderíamos ter discutido espaços de 5, 6 ou N dimensões com essa mesma facilidade. Isso é típico 
do poder da análise das componentes. Em termos físicos, esse espaço quadridimensional pode ser tomado como 
espaço de Minkowski, 

EC] = (ct,ax,y,2), (2.107) 


em que t é tempo. Esta é a fusão de espaço e tempo conseguida na relatividade especial. As transformações que 
descrevem as rotações em espaço quadridimensional são as transformações de Lorentz da relatividade especial. 
Encontramos essas transformações de Lorentz na Seção 4.6. 


Tensores Irredutíveis 
Para algumas aplicações, em particular em teoria quântica do momento angular, nossos tensores cartesianos não 
são particularmente convenientes. Em linguagem matemática, nosso tensor geral de segunda ordem A;; é redutível, 
o que significa que pode ser decomposto em partes de tensores de ordem mais baixa. Na verdade, já fizemos isso. 
Pela Equação (2.78), 

A= A; (2.108) 


é uma quantidade escalar, o traço de Aiz? 
Acabamos de mostrar que a porção anti-simétrica, 


Bij = (Ay — Aji), (2.109) 


!8Uma permutação é ímpar se envolver um número ímpar de trocas de índices adjacentes, tal como (0 1 2 3) — (0 2 1 3). Permutações 
pares surgem de um número par de transposições de índices adjacentes. (Na verdade, a palavra adjacente é desnecessária.) £0123 = +1. 
Uma abordagem alternativa, usando matrizes, é dada na Seção 3.3 (veja o Exercício 3.3.9). 
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é equivalente a um (pseudo)vetor ou 
Bi; = Ck permutação cíclica de 5, j, k. (2.110) 


Subtraindo o escalar A e o vetor Ck de nosso tensor original, temos um tensor de segunda ordem irredutível, 
simétrico, de traço zero, .S;;, no qual 
1 1 
Sij = zij + Aji) 5 3405, (2.111) 
com cinco componentes independentes. Então, finalmente, nosso tensor cartesiano original pode ser escrito 
1 
Aij = 34ðij + Ck + Sij. (2.112) 
As três quantidades A, C e Si; formam tensores esféricos de ordens O, 1 e 2, respectivamente, transformando- 
se harmônicos esféricos Y/! (Capítulo 12) para L = 0, 1 e 2. Mais detalhes sobre esses tensores esféricos e suas 


utilizações serão encontrados no Capítulo 4 e nos livros de autoria de Rose e Edmonds lá citados. 
Um exemplo específico da redução precedente é dado pelo tensor quadripolo elétrico simétrico 


Qu = | (Baia; — 1205) olen 22,23) da 


O termo —r20;; representa uma subtração do traço escalar (os três termos à = j). Os Q;; resultantes têm traço 
zero. 


Exercícios 
2.9.1 Um arranjo quadrado anti-simétrico é dado por 
0 C3 -=C 0 G -GI 
-C3 0 Ci =| -0 0 C3 | 
C2 -Cı 0 -C8 -03 0 


em que (C1, C2, C3) formam um pseudovetor. Admitindo que a relação 


1 ; 
C; = zE 


vale em todos os sistemas de coordenadas, prove que C7* é um tensor. (Essa é uma outra forma do 
teorema do quociente.) 


2.9.2 Mostre que o produto vetorial é exclusivo do espaço tridimensional; isto é, somente em três 
dimensões podemos estabelecer uma correspondência um - para - um entre as componentes de 
um tensor anti-simétrico (segunda ordem) e as componentes de um vetor. 


2.9.3 Mostre que em R$ 
(a) du = 3, 
(b) ĝijEijk = 0, 
(C) EipqEjpa = 20ij» 
(d) EijkEijk = 6. 
2.9.4 Mostre que em R? 
EijkEpak = Îipðjq — digôjp- 
2.9.5 (a) Expresse as componentes de vetor produto externo C, C = A x B, em termos de c;;; e das 


componentes de A e B. 
(b) Use a anti-simetria de c;;; para mostrar que A - A x B = 0. 


Resposta: (a) C; = Eijk Aj Bp. 


2.9.6 (a) Mostre que o tensor de inércia (matriz) pode ser escrito 


para uma partícula de massa m em (£1, £2, £3). 
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(b) Mostre que 
Lij = ~Ma Mij = —MEkXkEljmEm, 


em que Mi = ml 2eitk£p. Esta é a contração de dois tensores de segunda ordem e é idêntica 
ao produto matricial da Seção 3.2. 


2.9.7 Escreva V : V x A e V x Vọ em tensorial de tensor (com índices) em R3, de modo que fique 
óbvio que cada expressão se anula. 
o O 
RESP. V.V xA = eirs; z ^" 
É “Sb Bi Dad? 
o O 
V x Vo)i ijk = =m P- 
( x p) Eijk Oxi Oxk p 
2.9.8 Expressando produtos externos em termos de símbolos de Levi-Civita (£;jx), derive a regra BAC- 
CAB, Equação (1.55). 
Sugestão: A relação do Exercício 2.9.4 é útil. 
2.9.9 Verifique que cada um dos seguintes tensores de quarta ordem é isotrópico, isto é, tem a mesma 


forma independente de qualquer rotação dos sistemas coordenados. 
(a) Asjki = 05h» 
(b) Bijki = 0;kÔj1 + ÔuÔsk» 
(c) Cijkt = Ôikôjt — ÔidÔjk- 
2.9.10 Mostre que o símbolo de Levi-Civita de dois índices £;; é um pseudotensor de segunda ordem (em 
um espaço bidimensional). Isso contradiz a unicidade de ô;;) (Exercício 2.6.4)? 


2.9.11 Represente c;; por uma matriz 2 x 2 e, usando a rotação de matriz 2 x 2 da Seção 3.3, mostre que 
Eij é invariante sob transformações de similaridade ortogonais. 


2.9.12 Dado A% = Sei; B" com BY = — Bºº, anti-simétrico, mostre que 
Bro = mk A, 
2.9.13 Mostre que a identidade vetorial 
(A x B): (C x D) = (A - C)(B - D) — (A - D)(B : ©) 


(Exercício 1.5.12) resulta diretamente da descrição de um produto externo de c;;; e a identidade do 
Exercício 2.9.4. 


2.9.14 Generalize o produto externo de dois vetores para um espaço n dimensional para n = 4,5,.... 
Verifique a consistência de sua construção e discuta exemplos concretos. Veja o Exercício 1.4.17 
para o caso n = 2. 


2.10 Tensores Gerais 


A distinção entre transformações contravariantes e covariantes foi estabelecida na Seção 2.6. Então, por 
conveniência, restringimos nossa atenção às coordenadas cartesianas (nas quais a distinção desaparece). Agora, 
nestas duas seções finais, voltamos às coordenadas não-cartesianas e ressuscitamos a dependência contravariante 
e covariante. Assim como na Seção 2.6, será usado um índice superior (sobrescrito) para denotar dependência 
contravariante e um índice inferior (subscrito) para denotar dependência covariante. O tensor métrico da Seção 2.1 
será usado para relacionar índices contravariantes e covariantes. 

Nesta seção, damos ênfase à diferenciação, culminando na construção da derivada covariante. Vimos na Seção 
2.7 que a derivada de um vetor resulta em um tensor de segunda ordem, em coordenadas cartesianas. Em sistemas 
de coordenadas não-cartesianas, é a derivada covariante de um vetor, em vez da derivada ordinária, que dá um 
tensor de segunda ordem por diferenciação de um vetor. 


Tensor Métrico 

Vamos começar com a transformação de vetores de um conjunto de coordenadas (q!,q?°,q°) para outro 
r = (x1, £?, x3). As novas coordenadas são funções (em geral não-lineares) x(q!, q2, q?) das antigas, tais como 
coordenadas polares esféricas (r, 0, 4). Mas suas diferenciais obedecem à lei da transformação linear 


Ox. 
i — j 
dz’ = g (2.113a) 
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ou A 
dr = e;jdg’ (2.113b) 


em notação vetorial. Por conveniência, tomamos os vetores de base €; = (Sr, E ae), E2 € E3 para formar um 
conjunto dextrogiro. Esses vetores não são necessariamente ortogonais. Além disso, será imposta uma limitação ao 
espaço tridimensional somente para as discussões de produtos externos e rotacionais. Exceto nesses casos, esses 
e; podem estar em espaço N dimensional, incluindo o espaço-tempo quadridimensional da relatividade geral e 


especial. Os vetores de base €; podem ser expressos por 


or 


= 2.114 
dr” (2.114) 


E€; = 


como no Exercício 2.2.3. Todavia, note que, aqui, o €; não tem necessariamente grandeza unitária. Pelo Exercício 
2.2.3, vetores unitários são 


1 Or e 
e; = A; EE (sem somatório), 
e, portanto, 
e; = he; (sem somatório). (2.115) 


Os e; estão relacionados aos vetores unitários e; pelos fatores de escala h; da Seção 2.2. Os e; não têm dimensões; 
os €; têm as dimensões de h;. Dando um exemplo específico, em coordenadas polares esféricas, 


Er =€, =f, E) = reg = rô, E = rsen de, = rsen dp. (2.116) 


Em espaços euclidianos, ou em um espaço de Minkowski da relatividade especial, as derivadas parciais na Equação 
(2.113) são constantes que definem as novas coordenadas em termos das antigas. Nós as usamos para definir as 
leis de transformação de vetores nas Equações (2.59) e (2.62) e de tensores na Equação (2.66). Generalizando, 
definimos um vetor contravariante V’ sob transformações de coordenadas gerais se suas componentes se 
transformam segundo 


Or. 
ra E I 
vee a V (2.117a) 
ou l 
V’ = Viej (2.117b) 


em notação vetorial. Para vetores covariantes inspecionamos a transformação do operador gradiente 


o ðq O 
— = — — 2.118 
ôx? Ox ðq ( ) 
usando a regra da cadeia. Por 
xt Oq) ; 
PE E 2.119 
qi rE F Ca 
fica claro que a Equação (2.118) é relacionada com a transformação inversa da Equação (2.113), 
da. 
dj = E dri. (2.120) 
ox’ 
Por conseguinte, definimos um vetor covariante V; se 
dq? 
V dai Vi (2.121a) 
for válida ou, em notação vetorial, 
V’ = Vja, (2.121b) 
em que ef são os vetores contravariantes gfe; = ef. 
Tensores de segunda ordem são definidos como na Equação (2.66), 
rij _ ÔT Ox qm (2.122) 


“Og Oq 
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e tensores de ordem mais alta são definidos de modo semelhante. 
Como na Seção 2.1, construímos o quadrado de um deslocamento diferencial 


(ds)2 = dr - dr = (ei dg)? = €i: Ej dg dg’. (2.123) 


Comparando essa expressão com (ds)? da Seção 2.1, Equação (2.5), identificamos €; - Ej como o tensor métrico 
covariante 
Ei Ej = fij. (2.124) 


Fica claro que g;; é simétrico. A natureza de tensor de g;; resulta da regra do quociente, Exercício 2.8.1. Tomamos 
a relação 
9" gr; = 0"; (2.125) 


para definir o tensor contravariante correspondente g'*. O contravariante gt} entra como o inverso?” do covariante 
gkj- Usamos esse contravariante g'* para elevar índices, convertendo um índice covariante em um índice 
contravariante, como mostramos a seguir. De maneira semelhante, o covariante ggj será usado para reduzir índices. 
A escolha de g'* e 9kj para essa operação de elevação-redução é arbitrária. Qualquer tensor de segunda ordem (e 
seu inverso) serviria. Especificamente, temos 


gej = e vetores básicos covariantes 
contravariantes relacionados, 2.126 
gF = F’ componentes vetoriais covariantes e (212p) 
contravariantes relacionadas. 
Então, 
Jij e! = E como o índice correspondente (2.127) 
Gy? = EF, reduzindo relações. ` 


E preciso enfatizar mais uma vez que os e; e €? não têm grandeza unitária. Isso pode ser visto nas 
Equações (2.116) e no tensor métrico g;; para coordenadas polares esféricas e sua inversa g”: 


1 0 0 
1 0 0 E 1 
(g)=/0 10 (oj=| Bea 0 
0 O r2senZo 1 
0 0 = 
r2sen20 
Símbolos de Christoffel 
Vamos formar a diferencial de um escalar 1), 
dy = a dg. (2.128) 
oq 


Visto que dq? são as componentes de um vetor contravariante, as derivadas parciais 01) /ôq devem formar um 
vetor covariante, pela regra do quociente. O gradiente de um escalar se torna 
OW i 


Vy = T 


(2.129) 


Note que ôy /ðqİ não são as componentes de gradiente da Seção 2.2, porque e Æ e; da Seção 2.2. 

Passando para as derivadas de um vetor, constatamos que a situação é muito mais complicada, porque os vetores 
de base £; são, em geral, não-constantes. Lembre-se de que não estamos mais nos restringindo às coordenadas 
cartesianas e aos agradáveis e convenientes Å, y, 2! A diferenciação direta da Equação (2.117a) resulta em 


ƏV’: dat av zE qu 
— = — —— — V’ 2.1 
dy dy dq + dai op” s (2.130a) 


ou, em notação vetorial, : 
oV' oV’ i dE; 
Oq! Oq) Oq! 


(2.130b) 


20Se o tensor gy j for escrito como uma matriz, o tensor 9º é dado pela matriz inversa. 
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O lado direito da Equação (2.130a) difere da lei da transformação para um tensor misto de segunda ordem no 
segundo termo, que contém derivadas de segunda ordem das coordenadas «*. Estas últimas são não-zero para 
transformações de coordenadas não-lineares. 

Agora, d€;/0q” será alguma combinação linear dos €x, sendo que o coeficiente depende dos índices i e j da 
derivada parcial e do índice k do vetor de base. Escrevemos 


Ter (2.131a) 


(2.131b) 


r% é um símbolo de Christoffel da segunda espécie. Também é denominado coeficiente de conexão. Esses rs, 
não são tensores de terceira ordem e as OV'/0q” da Equação (2.130a) não são tensores de segunda ordem. As 
Equações (2.131) devem ser comparadas com os resultados citados no Exercício 2.2.3 (lembrando-se de que, em 
geral, e; 4 e;). Em coordenadas cartesianas, r% = () para todos os valores dos índices i, j e k. Esses símbolos de 
Christoffel com três índices podem ser calculados pelas técnicas da Seção 2.2. Este é o tópico do Exercício 2.10.8. 
A Equação (2.138) oferece um método mais fácil. Usando a Equação (2.114), obtemos 

ðe; Or de; 


— = =f e. 2.132 
Oq Oq Oq dq jiEk ( ) 


Por conseqüência, os símbolos de Christoffel são simétricos nos índices mais baixos: 
k —Tk 
r5 = Da (2.133) 
Símbolos de Christoffel como Derivadas do Tensor Métrico 


Muitas vezes é conveniente ter uma expressão explícita para os símbolos de Christoffel em termos de derivadas do 
tensor métrico. Como etapa inicial, definimos o símbolo de Christoffel da primeira espécie [:j, k] por 


lij, k] = 9mkNS;» (2.134) 


do qual resulta a simetria fij, k] = [ji, k]. Mais uma vez, esse [ij, k] não é um tensor de terceira ordem. Pela 
Equação (2.131b), 


m Ei 
lij, k] = gmke™ - dq 
ÕE; 
= Ep dg (2.135) 
Agora diferenciamos gij = E; - €j, Equação (2.124): 
OGij a ÕE; dE; 
dgk T dq TS ge 
= [ik,9] + [jk, i] (2.136) 
pela Equação (2.135). Então, 
= 1 f gik | Ogr _ Əgij 
kl = i 1! Ed 2.137 


s aksie 
Th =g lij, k] 


1 psf ôgik Əgjk gij 
= s - i ; 2.1 
29 (E T ðq! Oq" (2,188) 


Esses símbolos de Christoffel são aplicados na próxima seção. 
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Derivada Covariante 


Com os símbolos de Christoffel, a Equação (2.130b) pode ser reescrita como 


ðv’! Əv’ 


ke 
So TL e; + VT% (2.139) 


Agora, à e k no último termo são índices mudos. Permutando i e k (apenas neste único termo), temos 


ƏV! (Via 
=— j. 2.14 
aa — (ag + Vie ido 


A quantidade entre parênteses é denominada derivada covariante, Vi. Temos 


Əv’ | 
vi = o? a (2.141) 


O índice inferior ;j indica diferenciação em relação a q”. A diferencial dV’ se torna 


1 
dV' = a dg = 14 dq'je; (2.142) 
Uma comparação com as Equações (2.113) ou (2.122) mostra que a quantidade entre colchetes é a i-ésima 
componente contravariante de um vetor. Visto que dgí é a j-ésima componente contravariante de um vetor 
(novamente, Equação (2.113)), Vi deve ser a 1j-ésima componente de um tensor (misto) de segunda ordem (regra 
do quociente). As derivadas Covanantes das componentes contravariantes de um vetor formam um tensor misto de 
segunda ordem, Vi. 
Uma vez que símbolos de Christoffel se anulam em coordenadas cartesianas, a derivada covariante e a derivada 
parcial ordinária coincidem: 


Əv’ ; 
— = V} (coordenadas cartesianas) (2.143) 
ðq 5) 
A derivada covariante de um vetor covariante V; é dada por (Exercício 2.10.9) 
Vi = di — Val (2.144) 


Assim como Vi, V;.; é um tensor de segunda ordem. 

A importância da derivada covariante na física é que: “Uma substituição constante de derivadas parciais 
regulares por derivadas covariantes transporta as leis da física (sob a forma de componente) do espaço-tempo 
plano para o espaço-tempo curvo (riemanniano) da relatividade geral. De fato, esta substituição pode ser tomada 
como um enunciado matemático do princípio da equivalência de Einstein”?! 


Geodésicas, Transporte Paralelo 


A derivada covariante de vetores-tensores e os símbolos de Christoffel também podem ser abordados a partir de 
geodésicas. Uma geodésica em espaço euclidiano é uma linha reta. Em geral, é a curva de comprimento mais 
curto entre dois pontos e a curva ao longo da qual se movimenta uma partícula em queda livre. As elipses dos 
planetas são geodésicas ao redor do Sol, e a Lua está em queda livre ao redor da Terra sobre uma geodésica. Visto 
que podemos lançar uma partícula em qualquer direção, uma geodésica pode ter qualquer direção passando por 
um dado ponto. Por consegiiência, a equação da geodésica pode ser obtida do princípio variacional da óptica de 
Fermat (consulte o Capítulo 177 para a equação de Euler), 


ö fas =0, (2.145) 


em que ds? é a métrica, Equação (2.123), de nosso espaço. Usando a variação de ds?, 


2dsô ds = dg dq” 6 gi; + gij dq à dg) + gij dg” ô dg”, (2.146) 


21C, W. Misner, K. S. Thorne e J. A. Wheeler, Gravitation. San Francisco: W. H. Freeman (1973), p. 387. 
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na Equação (2.145), obtemos 


1 dg dq? dé d ; dq” d ; 
e — > gi; + gi; —— — ô dI + gi; — — ô daf | ds = 0, 2.147 
JE de Va t Died, OEI gs T =R C : 


em que ds mede o comprimento sobre a geodésica. Expressando as variações 


di; 
Ògij = T ô dq” = (01.9: )ô dq” 


em termos das variações independentes ô dq”, deslocando suas derivadas nos outros dois termos da Equação 
(2.147), integrando por partes e renomeando os índices de somatório obtemos 


1 (|dd, df dg dg Edo 
2 / É ds SU ge (on ds T riq | [9 da ds = 0. (2.148) 


O integrando da Equação (2.148), igualado a zero, é a equação geodésica. É a equação de Euler de nosso problema 
variacional. Expandindo 


dgik te dg) dgkj Ee dg 
ds — CI) p> de (ij) ig (2.149) 
ao longo da geodésica, encontramos 
1 dg' dg Pq 
ij jJi 19kj i =U. 2.1 
> dg qg (Oki T Osdik — igri) — Jik gz =0 (2.150) 


Multiplicando a Equação (2.150) por g”! e usando a Equação (2.125), encontramos a equação geodésica 


dq! dë dq 
A2 | ds gg 39 (idas + 0jJik — kij) = 0, (2.151) 


em que o coeficiente das velocidades é o símbolo de Christoffel ri; da Equação (2.138). 

Geodésicas são curvas que independem da escolha de coordenadas. Elas podem ser desenhadas passando por 
qualquer ponto do espaço em várias direções. Visto que o comprimento ds medido ao longo da geodésica é um 
escalar, as velocidades dq' /ds (de uma partícula em queda livre ao longo da geodésica, por exemplo) formam 
um vetor contravariante. Por consegiência, Vp dq” /ds é um escalar bem definido sobre qualquer geodésica, que 
podemos diferenciar de modo a definir a derivada covariante de qualquer vetor covariante Vp. Usando a Equação 
(2.151), obtemos, do escalar 


d dq! NV, dq! dg" 
ds (v: ds ) ~ ds ds + Mk ds? 

i gnk i dj 

_ Vpr dë dq VT? dg dg 


= — i 2.152 
ðq ds ds Eii ds ds (oo) 
dg? dq! (8V; l 
= —— = — DM). 
ds ds À ôg pra 
Quando o teorema do quociente é aplicado à Equação (2.152), ele nos diz que 
oV; 
us Cony (2.153) 
oq" 


é um tensor covariante que define a derivada covariante de Vp, consistente com a Equação (2.144). Tensores de 
ordens mais elevadas podem ser derivados de maneira semelhante. 
O segundo termo da Equação (2.153) define o transporte paralelo ou deslocamento, 


Vp = Ti Vig, (2.154) 


do vetor covariante V; desde o ponto de coordenadas q” até q' + óq'. O transporte paralelo, 6U*, de um vetor 
covariante U* pode ser encontrado pela invariância do produto escalar U*V;. sob o transporte paralelo, 


(UE Vi) = UF Vp + U¥SVy = 0, (2.155) 
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em conjunção com o teorema do quociente. 

Em suma, quando deslocamos um vetor até um ponto vizinho, o transporte paralelo impede que ele fique para 
fora de nosso espaço. Isso pode ser visto com clareza na superfície de uma esfera em uma geometria esférica, 
em que um vetor tangente deve permanecer tangente quando transladado ao longo de alguma trajetória sobre a 
esfera. Isso explica por que a derivada covariante de um vetor ou tensor é naturalmente definida transladando-a 
ao longo de uma geodésica na direção desejada. 


Exercícios 
2.10.1 As Equações (2.115) e (2.116) usam o fator de escala h;, citando o Exercício 2.2.3. Na Seção 2.2 
tínhamos nos restringido a sistemas de coordenadas ortogonais, embora a Equação (2.115) seja 
válida para sistemas não-ortogonais. Justifique a utilização da Equação (2.115) para sistemas não- 
ortogonais. 
2.10.2 (a) Mostre que e' - €; = a 
(b) Pelo resultado da parte (a), mostre que 


FP'=F.e' e F=F.e,. 


2.10.3 Para o caso especial do espaço tridimensional, sendo que (€1, E2, €3) definem um sistema de 
coordenadas dextrogiro, não necessariamente ortogonal, mostre que 


rS Ej X Ek 


E = ————, 
Ej X Ek’ Ei 


i, j, k = 1, (2, 3 e permutações cíclicas). 


Nota: Esses vetores de base contravariantes e definem o espaço do reticulado recíproco da Seção 
1.5. 


2.10.4 | Prove que o tensor métrico contravariante é dado por 
gi =e ei. 

2.10.5 Se os vetores covariantes €; são ortogonais, mostre que 

(a) gij é diagonal, 

(b) g” = 1/gi;; (sem somatório), 

(c) le*| = 1/Je;|. 
2.10.6 Derive os tensores métricos covariantes e contravariantes para coordenadas cilíndricas circulares. 
2.10.7 Transforme o lado direito da Equação (2.129), 


ob i 


Vy = dq ; 


para a base e; e verifique que essa expressão está de acordo com o gradiente desenvolvido na Seção 
2.2 (para coordenadas ortogonais). 


2.10.8 Avalie de;/0q para coordenadas polares esféricas e, a partir desses resultados, calcule r% para 
coordenadas polares esféricas. 
Nota: O Exercício 2.5.2 oferece uma maneira de calcular as derivadas parciais necessárias. Lembre- 
se de que 
E1 =f mas E2 = rô e Es = rsen 0%. 


2.10.9 Mostre que a derivada covariante de um vetor covariante é dada por 


Sugestão: Diferencie 
e -ej = 6. 


2.10.10 Verifique que V;.; = gik VE, mostrando que 


oV; A oVk mk 
dai = VTi; = (do TV Rh 
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2.10.11 Pelo tensor métrico cilíndrico circular g;;, calcule o r% para coordenadas cilíndricas circulares. 
Nota: Há somente três T não-nulos. 


2.10.12 Usando o r do Exercício 2.10.11, escreva as derivadas covariantes Vi de um vetor V em 
coordenadas cilíndricas circulares. 


2.10.13 Um cristal triclínico é descrito usando um sistema de coordenadas oblíquo. Os três vetores 
covariantes de base são 


Ej = 1,5%, 
EG = 0, 4X E 1,6y, 
e3=0,2%+0,39 + 1,02. 


(a) Calcule os elementos do tensor métrico covariante g;;. 
(b) Calcule os símbolos de Christoffel de três índices, TE. (Esse é um cálculo “por inspeção”) 
(c) Pela forma do produto externo do Exercício 2.10.3 calcule o vetor de base contravariante e°. 
(d) Usando as formas explícitas e? eci, verifique que ed .e;= 6i. 
Nota: Se fosse necessário, o tensor métrico covariante poderia ser determinado achando o inverso 
de gij ou achando e° e usando g” = e! . e). 

2.10.14 Verifique que 


P 1 f Əgik | Ogjn Ig 
liik = 5 a t E Sl 
2 | ðq oq oq 
Sugestão: Substitua a Equação (2.135) no lado direito e mostre que resulta uma identidade. 
2.10.15 Mostre que, para o tensor métrico g;;.» = 0, gk = 0. 


2.10.16 Mostre que o deslocamento paralelo dqt = d2g' ao longo de uma geodésica. Construa uma 
geodésica por deslocamento paralelo de ô dq”. 


2.10.17 Construa a derivada covariante de um vetor V? por transporte paralelo partindo do procedimento 

limitador ns a 
Vita da) = (4) 
dgi >0 dgi 


2.11 Operadores de Derivadas de Tensores 


Nesta seção a diferenciação covariante da Seção 2.10 é aplicada para derivar novamente as operações diferenciais 
de vetores da Seção 2.2 sob forma de tensor geral. 


Divergência 
Substituindo a derivada parcial pela derivada covariante, admitimos que a divergência é 
ðv’ 


V.V=Vi= aq + VÝT. (2.156) 


Expressando T$, pela Equação (2.138), temos 


i _ LiimbôGim | Ogum  Ogik 
T (E E aae), (2.157) 


Quando contraídos com g'” os dois últimos termos da chave se cancelam, visto que 


gim ĉ Ikm — „mi Ogki = im ÔJik 


— = = 2.158 
dg g Dgr g dam ( ) 
Então, 
E e=" 9" : 2.159 
Pela teoria dos determinantes, Seção 3.1, 
= gym! (2.160) 


Og" ` Og * 
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em que g é o determinante da métrica, g = det(g;;). Substituindo esse resultado na Equação (2.158), obtemos 


1 g 1 8g? 


i 


l = . 2.161 
ik 2g Oq" g!/2 Oq" ( ) 
Isso resulta em TE 
Vovi- — ay 
V.V=V; 772 Du (g PV). (2.162) 


Para comparar esse resultado com a Equação (2.21), note que hıhzha = 9! e V’ (coeficiente contravariante de 
ei) = V;/h; (sem somatório), em que V; é o coeficiente de e;. 


Laplaciano 
Na Seção 2.2, a substituição do vetor Vem V:V por Vy levou ao laplaciano V - Vy. Aqui, temos um 
contravariante V*. Usando o tensor métrico para criar um contravariante V1), fazemos a substituição 


- dy 
yi ik 
g Oq" 
Então, o laplaciano V.V y torna-se 
v.v 1 o 1/2 ik oy 63 
s m . é 2.1 
Y g1/2 Oq" (o g Og" ( ) 


Para os sistemas ortogonais da Seção 2.2 o tensor métrico é diagonal e o contravariante g” (sem somatório) se 
torna 


A Equação (2.163) se reduz a 


1 O (hahshs O 
V.Vy= (2 Y , 
hyhohs oq" h; oq" 

de acordo com a Equação (2.22). 
Rotacional 
A diferença de derivadas que aparece no rotacional (Equação (2.27) será escrita como 

oV; oV; 

dg) Oq 


Mais uma vez, lembre-se de que, aqui, as componentes V; são coeficientes dos vetores de base (não-unitários) 
contravariantes e”. Os V; da Seção 2.2 são coeficientes de vetores unitários e;. Somando e subtraindo, obtemos 

oV; ƏV;  OVi oV; 

dq) dq Oq Oq 

= Vij — Vja, (2.164) 


k k 
Vel; + Vel; 


usando a simetria dos símbolos de Christoffel. A diferença característica de derivadas do rotacional se torna uma 
diferença de derivadas covariantes e, portanto, é um tensor de segunda ordem (covariante em ambos os índices). 
Como enfatizado na Seção 2.9, a forma vetorial especial do rotacional existe somente em espaço tridimensional. 

Pela Equação (2.138) fica claro que todos os três símbolos de Chistoffel com três índices se anulam no espaço 
de Minkowski e no espaço-tempo real da relatividade especial com 


1 0 0 0 
o 0 — 0 0 
=| o 0 -1 0 
0 0 0 —1 
Aqui, 
To = ct, TI =T, £2 = Y, e £3 = Z. 


Isso conclui o desenvolvimento de operadores diferenciais em forma de tensor geral. (O gradiente foi dado na 
Seção 2.10.) Além de suas aplicações nos campos de elasticidade e eletromagnetismo, esses diferenciais também 
encontram aplicação na mecânica (mecânica lagrangiana, mecânica hamiltoniana e nas equações de Euler para 
rotação de corpo rígido); na mecânica dos fluidos; e talvez o mais importante, no espaço-tempo curvo de modernas 
teorias da gravidade. 
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Exercícios 
2.11.1 | Verifique a Equação (2.160), 


para o caso específico de coordenadas polares esféricas. 


2.11.2 Começando com a divergência em notação de tensor, Equação (2.162), desenvolva a divergência de 
um vetor em coordenadas polares esféricas, Equação (2.47). 


2.11.3 O vetor covariante A; é o gradiente de um escalar. Mostre que a diferença de derivadas covariantes 
A;.j — Aj; se anula, 
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Determinantes e Matrizes 


3.1 Determinantes 


Iniciamos o estudo de matrizes resolvendo equações lineares que nos levarão a determinantes e matrizes. O 
conceito de determinante e a sua notação foram introduzidos pelo célebre matemático e filósofo alemão Gottfried 
Wilhelm von Leibniz. 


Equações Lineares Homogêneas 

Uma das maiores aplicações de determinantes é no estabelecimento de uma condição para a existência de uma 
solução não-trivial para um conjunto de equações algébricas lineares homogêneas. Suponha que temos três 
incógnitas 714, £2, %3 (ou n equações com n incógnitas): 


mz + a2£2 + a3z3 = 0, 
bızı + boxo T b3 £3 = 0, (3.1) 


Citi T Colo T C3T3 = 0. 


O problema é determinar sob que condições há qualquer solução à parte da trivial xı = 0, z2 = 0, z3 = 0. 
Se usarmos notação vetorial x = (x1, £2, %3) para a solução e três linhas a = (a1,02,03), b = (b1, b2,b3), 
c = (c1, c2, c3) de coeficientes, então as três Equações (3.1) tornam-se 


a:x=0, b.x=0, cx=0. (3.2) 
A interpretação geométrica dessas três equações vetoriais é que x é ortogonal a a, be c. Se o volume abrangido 
por a, b, c dado pelo determinante (ou produto escalar triplo, veja a Equação (1.50) da Seção 1.5)) 


ay a2 Q3 
D; = (a x b) -c = det(a,b,c) = | bı b2 bs (3.3) 


Ci C2 63 


não for zero, então existe apenas a solução trivial x = 0. 

Ao contrário, se o citado determinante de coeficientes for nulo, então um dos vetores linha é uma combinação 
linear dos outros dois. Vamos admitir que c encontre-se no plano definido por a e b, isto é, que a terceira equação 
seja uma combinação linear das duas primeiras e não-independente. Então, x é ortogonal àquele plano, de modo 
que x ~ a x b. Uma vez que equações homogêneas podem ser multiplicadas por números arbitrários, somente 
razões dos x; são relevantes, para os quais então obtemos razões de determinantes 2 x 2 


zı  a2bz — a3b2 


T3 ab» — azby 


3.4 
T2 = a1b3 am a3bı ( ) 


T3 aıb2 — a2bı 


a partir dos componentes do produto externo a x b, contanto que £3 ~ abs — az2b1 # 0. Essa é a regra de 
Cramer para três equações lineares homogêneas. 


Equações lineares não-homogêneas 
O caso mais simples de duas equações com duas incógnitas, 


ax, + agito = a3, bızı + boxo = ba, (3.5) 


126 
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pode ser reduzido ao caso anterior inserindo-a em um espaço tridimensional com um vetor solução x = 
(x1, £2, —1) e vetores linha a = (a1, a2, a3), b = (b1, bo, b3). Como antes, as Equações (3.5) em notação vetorial, 
a-x=0eb-x = 0, implicam que x ~ a x b, portanto a análoga das Equações (3.4) é válida. Entretanto, para 
que isso se aplique, a terceira componente de a x b não deve ser zero, isto é, abs — aoby Æ 0, porque a terceira 
componente de x é —1 4 0. O resultado disso são os x; sob a forma 


a3 a2 
a3b2 aR bza2 b3 bo 
tı = = 

aıbə a abı a Q2 (3.6a) 

bi b2 

ai Q3 

a1b3 — agb bi bs 
T2 n: r3 or = (3.6b) 

a bə Ka a2bı a a2 

bi bo 
O determinante no numerador de xı(x2) é obtido do determinante dos coeficientes | ba be | pela substituição do 


primeiro (segundo) vetor coluna pelo vetor (5) do lado não-homogêneo da Equação (3.5). Essa é regra de 


Cramer para um conjunto de duas equações lineares não-homogêneas com duas incógnitas. 
Essas soluções de equações lineares em termos de determinantes podem ser generalizadas para n dimensões. O 
determinante é um arranjo quadrado 


aq a2 ... Am 
D, = Bi, obag =e Aba (3.7) 
C1 C2 ... Cn 


de números (ou funções), aqui, em nosso caso, os coeficientes de n equações lineares. O número n de colunas 
(e de linhas) no arranjo costuma ser denominado ordem do determinante. A generalização da expansão na 
Equação (1.48) do produto escalar triplo (de vetores linhas de três equações lineares) leva ao seguinte valor do 
determinante D, em n dimensões 

Di= È, emrmibyonoooo (3.8) 

iss. 
em que Eijk... análogo ao símbolo de Levi-Civita da Seção 2.9, é +1 para permutações pares! (ijk---) de 
(123---n),—1 para permutações ímpares e zero se algum índice for repetido. 
Especificamente, para o determinante de terceira ordem Ds da Equação (3.3), a Equação (3.8) leva a 


Ds = +a1b2C3 ia a1b3C2 im a2b1C3 + asbsc1 + agbi co = agboc1. (3.9) 


Então, o determinante de terceira ordem é essa combinação linear particular de produtos. Cada produto contém 
um e somente um elemento de cada linha e de cada coluna. Cada produto é adicionado se as colunas (índices) 
representarem uma permutação par e subtraído se tivermos uma permutação ímpar. A Equação (3.3) pode ser 
considerada a notação abreviada para a Equação (3.9). O número de termos no somatório (Equação (3.8) é 24 para 
um determinante de quarta ordem, n! para um determinante de ordem n. Por causa da aparição dos sinais negativos 
na Equação (3.9) (e possivelmente também nos elementos individuais), pode haver considerável cancelamento. É 
bem possível que um determinante de grandes elementos tenha um valor muito pequeno. 

Diversas propriedades de determinantes de ordem n resultam da Equação (3.8). Mais uma vez, para sermos 
específicos, a Equação (3.9) para determinantes de terceira ordem é usada para ilustrar essas propriedades. 


Desenvolvimento Laplaciano por Menores 
A Equação (3.9) pode ser escrita 


Ds = an (boca = b3c2) = a2(b1c3 = b3c1) + as(bico = boc1) 


do bs bi bs bi bo 
= uq — à2 + ag . (3.10) 
Co C3 ci C3 Cj C92 
"Em uma seqüência linear, abcd - - - , qualquer transposição única, simples, de elementos adjacentes dá como resultado uma permutação 


ímpar da segiiência original: abcd — bacd. Duas dessas transposições resultam em uma permutação par. Em geral, um número ímpar dessas 
trocas de elementos adjacentes resulta em uma permutação ímpar; um número par dessas transposições resulta em uma permutação par. 
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Em geral, o determinante de ordem n pode ser expandido como uma combinação linear dos produtos dos elementos 
de qualquer linha (ou de qualquer coluna) e dos determinantes de ordem (n — 1) formados pela eliminação da 
linha e da coluna do determinante original no qual o elemento aparece. Esse arranjo reduzido (2 x 2 neste exemplo 
específico) é denominado menor. Se o elemento estiver na i-ésima linha da j-ésima coluna, o sinal associado com 
o produto é (—1)**?. O menor que tem esse sinal é denominado co-fator. Se M;; for usado para designar o menor 
formado omitindo-se a i-ésima linha e a j-ésima coluna e C;; for o co-fator correspondente, a Equação (3.10) se 


torna 
3 


3 
Ds = Sam; = X ajCij. (3.11) 
j=1 


j=1 


Neste caso, expandindo ao longo da primeira linha, temos i = 1 e o somatório sobre j as colunas. 
Esta expansão de Laplace pode ser usada com vantagem na avaliação de determinantes de ordens mais elevadas 
nos quais vários elementos são zero. Por exemplo, para achar o valor do determinante 


0 1 0 0 
-1 0 0 0 
D= o 001 (3.12) 
0 0 —1i 0 
expandimos através da linha superior para obter 
-1 0 0 
D= (=| 0 0 1). (3.13) 
0 —1 0 
Novamente, expandindo pela linha superior, obtemos 
0 1 0 1 
= fi asse a NA E E S paa 
D = (—1) - (—1) en) 4 RE Ja (3.14) 


(Este determinante D — Equação (3.12) é formado a partir de uma das matrizes de Dirac que aparecem na teoria 
relativista do elétron de Dirac na Seção 3.4.) 


Anti-Simetria 


O determinante muda de sinal se quaisquer duas linhas forem permutadas ou se quaisquer duas colunas forem 
permutadas. Isso resulta do caráter par-ímpar do £ de Levi-Civita na Equação (3.8) ou, explicitamente, da forma 
das Equações (3.9) e (3.10). 

Essa propriedade foi usada na Seção 2.9 para desenvolver uma combinação linear totalmente anti-simétrica. 
Também é usada com freqiiência em mecânica quântica na construção de uma função de onda de muitas partículas 
que, de acordo com os princípios de exclusão de Pauli, será anti-simétrica sob a permutação de quaisquer duas 
partículas idênticas de spin 5 (elétrons, prótons, nêutrons etc.). 

e Como um caso especial de anti-simetria, qualquer determinante com duas linhas iguais ou com duas colunas 
iguais é igual a zero. 

e Se cada elemento em uma linha ou cada elemento em uma coluna for zero, o determinante é igual a zero. 

e Se cada elemento em uma linha ou cada elemento em uma coluna for multiplicado por uma constante, o 
determinante é multiplicado por aquela constante. 

e O valor de um determinante não se altera se um múltiplo de uma linha for adicionado (coluna por coluna) a uma 
outra linha ou se um múltiplo de uma coluna dor adicionado (linha por linha) a uma outra coluna. 


Temos 
a Q2 Q3 a T kaz az as 
bi bz bs |=] bi+kbz bə bgl. (3.15) 
C1 C2 cg Ci kcz [65) C3 


2A inversão de sinal é razoavelmente óbvia para a permutação de duas linhas (ou colunas) adjacentes, porque essa é uma permutação 
claramente ímpar. Mostre que a permutação de quaisquer duas linhas ainda é uma permutação ímpar. 

3Isso deriva do significado geométrico do determinante como o volume do paralelepípedo abrangido por seus vetores coluna. Deslocar o 
paralelepípedo para o lado sem mudar sua altura não modifica o volume. 
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Usando o desenvolvimento de Laplace no lado direito, obtemos 


a + kaz a Q3 Q1 Q2 Q3 a Q2 Q3 
bi +kbz do ba |=| bi bz ba l+kl da bə da |, (3.16) 
Cj T kco C2 C3 C1 C2 cg C2 C2 cg 


então, pela propriedade de anti-simetria, o segundo determinante do lado direito de Equação (3.16) se anula, 
verificando a Equação (3.15). 

Como um caso especial, um determinante é igual a zero se quaisquer duas linhas forem proporcionais ou 
quaisquer duas colunas forem proporcionais. 

Algumas relações úteis envolvendo determinantes ou matrizes aparecem nos Exercícios das Seções 3.2 e 3.4. 

Voltando às Equações (3.1) homogêneas e multiplicando o determinante dos coeficientes por xı, e então 
somando x» vezes a segunda coluna e x3 vezes a terceira coluna, podemos estabelecer diretamente a condição 
para a presença de uma solução não-trivial para as Equações (3.1): 


a dz Q3 AX Q2 Q3 
bızı bo bs = 


Cı1Tı C2 cg 


Q11 T A22 T agia Q2 Q3 
bixi + b2£2 + bars bo bz 
Citi T Cola T Cais C2 C3 


Ti bı bo bs = 
C1 Co C3 


0 a2 as 
=D b bz =; (3.17) 
0 C2 C3 


Portanto, xı (e€ £2 e £3) devem ser zero a menos que o determinante de coeficientes se anule. Ao contrário (veja 
o texto após da Equação (3.3), podemos mostrar que, se o determinante dos coeficientes desaparecer, existe, de 
fato, uma solução não-trivial. Isso é usado na Seção 9.6 para estabelecer a dependência ou independência linear 
de um conjunto de funções. 

Se nossas equações lineares forem não-homogêneas, isto é, assim como nas Equações (3.5), se os zeros no 
lado direito das Equações (3.1) forem substituídos por a4, b4 e c4, respectivamente, então, pela Equação (3.17), 
obtemos 


aq @2 Q3 
ba bo b3 
AE (3.18) 
a @2 Q3 
bi bo bs 
Cc co 63 


que generaliza a Equação (3.6a) para n = 3 dimensões etc. Se o determinante dos coeficientes se anular, o conjunto 
não-homogêneo de equações não tem nenhuma solução — a menos que os numeradores também desapareçam. 
Nesse caso, podem existir soluções, mas elas não são únicas (veja um exemplo específico no Exercício 3.1.3). 

Para trabalho numérico essa solução por determinante, Equação (3.18), é extremamente difícil de manejar. O 
determinante pode envolver números grandes com sinais alternados, e na subtração de dois números grandes o erro 
relativo pode se elevar a ponto de o resultado ficar sem sentido. Além disso, embora o método do determinante 
seja ilustrado aqui com três equações e três incógnitas, não seria difícil termos 200 equações com 200 incógnitas 
que, por envolver até 200! termos em cada determinante, representam um desafio até mesmo para computadores 
de alta velocidade. Tem de haver um modo melhor. 

Na verdade, há modos melhores. Um dos melhores é um processo direto que costuma ser denominado 
eliminação de Gauss. Para ilustrar essa técnica, considere o seguinte conjunto de equações. 


Exemplo 3.1.1 


Resolva 


ELIMINAÇÃO DE GAUSS 


3r +2y+z=11 
2r + 3y +2z=13 
x+y + 4z = 12. 


(3.19) 


O determinante das equações lineares não-homogêneas (3.19) é 18, portanto existe uma solução. 
Por conveniência e para a acurácia numérica ótima, as equações são rearranjadas de modo que os maiores 


“livro” — 2007/81 — 15:06 — page 130 — #140 


130 Física Matemática Arfken e Weber ELSEVIER 


coeficientes fiquem ao longo da diagonal principal (do canto superior esquerdo ao canto inferior direito). Isso já 
foi feito no conjunto precedente. 

A técnica de Gauss é usar a primeira equação para eliminar a primeira incógnita, x, das equações restantes. 
Então, a segunda (nova) equação é usada para eliminar y da última equação. Em geral, prosseguimos de cima para 
baixo por todo o conjunto de equações e, então, após determinarmos uma das incógnitas, continuamos de baixo 
para cima para resolver para cada uma das outras incógnitas sucessivamente. 

Dividindo cada linha por seu coeficiente inicial, vemos que as Equações (3.19) se tornam 


r+ žy t iz= = (3.20) 
c+y+4z=12 


Agora, usando a primeira equação, eliminamos x da segunda e terceira equações: 


z+iy+jz= i 
ey +g= E (3.21) 
1 11, — 25 
qq 
e 
z+iytjz= i 
y+iz= E (3.22) 
y+ 1lz = 25. 
Repetindo a técnica, usamos a nova segunda equação para eliminar y da terceira equação: 
ceu de= 8 
1. AT 
542 = 108, 
ou 
Qu, 
Por fim, prosseguindo de baixo para cima, obtemos 
y+5x2=¥, 
ou 
y= 3; 


Então, tendo determinado z e y, 


A técnica talvez não pareça tão elegante quanto a Equação (3.18), mas se adapta bem a computadores e é muito 
mais rápida do que o tempo gasto com determinantes. 
Essa técnica de Gauss pode ser usada para converter um determinante para a forma triangular 


a by Ci 
D = 0 bo C2 
0 0 C3 


para um determinante de terceira ordem cujos elementos não devem ser confundidos com os da Equação (3.3). 
Nessa forma, D = aıb2¢3. Para um determinante de ordem n a avaliação da forma triangular requer somente 
multiplicações, em comparação com as n! requeridas para o caso geral. 

Uma variação dessa eliminação progressiva é conhecida como eliminação de Gauss-Jordan. Começamos como 
na eliminação de Gauss, que já examinamos, mas cada nova equação considerada é usada para eliminar uma 
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variável de todas as outras equações e não apenas das que estão abaixo dela. Se tivéssemos usado essa eliminação 
de Gauss-Jordan, a Equação (3.23) teria se tornado 


atiz=L 
y+iz=¥# (3.24) 
=), 


r 


usando a segunda equação das Equações (3.22) para eliminar y da primeira e da terceira equações. Então, a terceira 
equação das Equações (3.24) é usada para eliminar z da primeira e da segunda, resultando em 


<a (3.25) 


Voltaremos a essa técnica de Gauss-Jordan na Seção 3.2 para inverter matrizes. 

Uma outra técnica adequada para uso em computador é a técnica de iteração de Gauss-Seidel. Cada técnica tem 
suas vantagens e desvantagens. Os métodos de Gauss e de Gauss-Jordan podem apresentar problemas de precisão 
para grandes determinantes. Isso também é um problema para inversão de matriz (Seção 3.2). O método Gauss- 
Seidel, por ser iterativo, pode apresentar problemas de convergência. O pacote Scientific Subroutine Package (SSP) 
da IBM usa as técnicas de Gauss e Gauss-Jordan. O método iterativo de Gauss-Seidel e os métodos de eliminação 
de Gauss e Gauss-Jordan são discutidos com considerável detalhe por Ralston e Wilf e também por Pennington. 
Códigos para computadores em FORTRAN e em outras linguagens de programação e literatura extensiva para a 
eliminação de Gauss-Jordan e outras também são dados por Press et al. E 


Dependência Linear de Vetores 


Dois vetores bidimensionais não-zero 


= aj = Q21 
a= (ou ) #0, a= ( %2 ) z0 


são definidos como linearmente dependentes se for possível encontrar dois números xı, x2 que não sejam 
ambos zero, de modo que a relação linear xa + £2a2 = O seja válida. São linearmente independentes se 
zı = 0 = x» for a única solução dessa relação linear. Escrevendo-a em componentes cartesianas, obtemos duas 
equações lineares homogêneas 


at + a21£2 = Ü, a12£1 + a22£2 = 0 


das quais extraímos o seguinte critério para independência linear de dois vetores usando a regra de Cramer. Se 
ai, a2 abrangerem uma área não-zero, isto é, seu determinante |41} 421 | 2 0, então o conjunto de equações 
lineares homogêneas tem somente a solução x, = O = z2. Se o determinante for zero, então existe uma 
solução não-trivial z1, z2, e nossos vetores são linearmente dependentes. Em particular, os vetores unitários 
nas direções x e y são linearmente dependentes, sendo que a relação linear x11 + ot = (2) = (5) tem somente 
a solução trivial xı = 0 = x2. 

Três ou mais vetores em um espaço bidimensional são sempre linearmente dependentes. Assim, o número 
máximo de vetores linearmente independentes em espaço bidimensional é 2. Por exemplo, dados aj, a2, as, 
z1aı + x9a2 + t3a3 = 0, a relação linear sempre tem soluções não-triviais. Se um dos vetores for zero, a 
dependência linear é óbvia porque o coeficiente do vetor zero pode ser escolhido como não-zero e os coeficientes 
dos outros vetores como zero. Portanto, admitimos que todos eles sejam não-zero. Se a; e a» são linearmente 
independentes, escrevemos a relação linear 


a11%1 + aoj%2 = —Q3113, aj2%1 + a22£%2 = —aga%3, 


como um conjunto de duas equações lineares não-homogêneas e aplicamos a regra de Cramer. Visto que o 
determinante é não-zero, podemos achar uma solução não-trivial x1, £2 para qualquer x3 não-zero. Esse argumento 


4A. Ralston e H. Wilf, editores, Mathematical Methods for Digital Computers. Nova York: Wiley 1960; R. H. Pennington, Introductory 
Computer Methods and Numerical Analysis. Nova York: Macmillan 1970. 

SW. H. Press, B. P. Flannery, S. A. Teukolsky e W. T. Vetterling, Numerical Recipes, 2? ed., Cambridge, UK: Cambridge University Press 
(1992), Capítulo 2. 
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vale para qualquer par de vetores linearmente independentes. Se todos os pares forem linearmente dependentes, 
qualquer dessas relações lineares é uma relação entre os três vetores e damos tudo por terminado. Se houver mais do 
que três vetores, escolhemos quaisquer três deles e aplicamos o raciocínio precedente e colocamos os coeficientes 
dos outros vetores, xj = 0, na relação linear. 

e Vetores mutuamente ortogonais são linearmente independentes. 


Admita uma relação linear $; c;v; = 0. Introduzindo o produto direto de v; nessa expressão usando v; - v; = 0 
para j  i, obtemos c;v; - vj = 0, portanto, todo cj = 0 porque vi 0. 

A extensão desses teoremas é direta para n ou mais vetores em um espaço euclidiano dimensional n. Assim, 
o número máximo de vetores linearmente independentes em espaço n dimensional é n. Os vetores unitários 
de coordenadas são linearmente independentes porque abrangem um paralelepípedo não-zero em um espaço n 
dimensional e seu determinante é unitário. 


Procedimento de Gram-Schmidt 

Em um espaço vetorial dimensional n com um produto interno (ou escalar), sempre podemos construir uma 
base ortonormal de n vetores w; com w; - wj = ð;j partindo de n vetores linearmente independentes v;, 
= 0,1 asa T: 


Começamos normalizando vo para a unidade, definindo wọ = — 


. Então projetamos vo formando u; = 


Vvo? 
vı + 19 Wo, escolhendo o coeficiente de mistura a10, de modo que vo - uy = 0. Fazendo o produto escalar de vo 
em u; temos a10 = —*2H = —v, - wo. Mais uma vez normalizamos u; definindo w, = Var Aqui, u? 4 0 
Vo us 


porque vo, vı são linearmente independentes. Essa primeira etapa se generaliza para 
u; = Vj + ajoWo + QjiWı +. + Qjj—1Wj—1,; 


. — . id o u; . sa 
com coeficientes aji = —v; - W;. A normalização de w; = — conclui nossa construção. 
u‘ 


Devemos observar que, embora esse procedimento de Gram-S chmidt seja uma maneira possível de construir um 
conjunto ortogonal ou ortonormal, os vetores w; não são únicos. Há um número infinito de conjuntos ortonormais 
possíveis. 

Como ilustração da liberdade envolvida, considere dois vetores (não-paralelos) A e B no plano xy. Podemos 
normalizar A para grandeza unitária e então formar B’ = aA + B, de modo que B’ seja perpendicular a A. 
Normalizando B’ concluímos a ortogonalização de Gram-Schmidt para dois vetores. Mas quaisquer dois vetores 
unitários perpendiculares, tais como $ e y, poderiam ter sido escolhidos como nosso conjunto ortonormal. 
Novamente, com um número infinito de possíveis rotações de $ e y ao redor do eixo z, temos um número infinito 
de possíveis conjuntos ortonormais. 


Exemplo 3.1.2 VETORES POR ORTOGONALIZAÇÃO DE GRAM-SCHMIDT 
Para ilustrar o método, consideramos dois vetores 


u(i) v=() 


que não são nem ortogonais nem normalizados. Normalizando o primeiro vetor wo = Vo/ V2, construímos 
u, = Vi + q19Wo de modo que seja ortogonal a vo. Isso nos dá 


u1 vo = 0 = vi -vo + ovo = —1+aov2, 


portanto, o coeficiente ajustável de mistura ało = 1/ v2. O resultado é 


as (0 )ri(1)=5(4): 


portanto, o segundo vetor ortonormal se torna 


(5) 


Verificamos que wo - w1 = 0. Os dois vetores wo, w1 formam um conjunto ortonormal de vetores, uma base de 
espaço euclidiano bidimensional. E 


ELSEVIER 
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Exercícios 


3.11 


3.1.2 


3.1.4 


3.1.7 


Avalie os seguintes determinantes: 


101 120 1 T A ` s 
1 1 2 m = 
1 0 0 0 3 1 
0 0 y3 0 


Teste o conjunto de equações lineares homogêneas 
x + 3y +3z =0, v—oytz=0, 2x +y+32=0 


para verificar se ele possui uma solução não-trivial e ache uma solução. 


Dado o par de equações 


xz +2y=3, 2x + 4y = 6, 
(a) Mostre que o determinante dos coeficientes se anulam. 
(b) Mostre que os determinantes do numerador (Equação (3.18)) também se anulam. 
(c) Ache ao menos duas soluções. 
Expresse as componentes de A x B como determinantes 2 x 2. Então mostre que o produto escalar 
A-(A x B) resulta em uma expansão laplaciana de um determinante 3 x 3. Por fim, note que duas 
linhas do determinante 3 x 3 são idênticas e, por conseguinte, que A - (A x B) = 0. 
Se Ci; é o co-fator do elemento a;; (formado pela eliminação da i-ésima linha e da j-ésima coluna 
e inclusão de um sinal (—1)'+?), mostre que 
(a) Dj aijCij = 254 ajiCji = | Al, em que | À 
(b) X QijCik = Jy ajiCki = 0,9 k. 
Um determinante com todos os elementos de ordem unitária pode ser surpreendentemente pequeno. 
O determinante de Hilbert H;; = (i + j — 1)7}, i,j =1,2,...,n é notório por seus valores 
pequenos. 


é o determinante com os elementos aij, 


(a) Calcule o valor dos determinantes de Hilbert de ordem n para n = 1,2 e 3. 

(b) Se houver uma sub-rotina disponível, ache os determinantes de Hilbert de ordem n para n = 4, 
5e6. 

Det( Hn) 

1. 

8,33333 x 1072 


Resposta: n 
1 
2 
3 4,62963 x 1074 
4 
5 


1,65344 x 1077 
3,74930 x 10712 
6 5,36730 x 10718 


Resolva o seguinte conjunto de equações lineares simultâneas. Os resultados devem ter cinco casas 
decimais. 
1,074 + 0, 9x2 + 0, 8x3 + 0, 4z4 + 0, 1x5 = 1,0 
0, 9x1 + 1, 0x£2 + 0, 8£3 + 0, 5x4 + 0, 2x5 +0,1x6 = 0,9 
0, 8x1 + 0, 8x2 + 1,023 + 0, Tz4 + 0, 4x5 +0, 2z = 0,8 
0,474 + 0, 5£2 + 0, T£3 + 1, 0x4 + 0, 6x5 + 0, 3z6 = 0,7 
0, 1x4 + 0, 2x2 + 0, 4z3 + 0, 6x4 + 1,075 + 0, 5x6 = 0,6 
0, 1x, + 0, 2x3 + 0, 3x4 + 0, 5z5 + 1,0x6 = 0,5. 


Nota: Essas equações também podem ser resolvidas por inversão de matriz, Seção 3.2. 


Resolva as equações lineares a-x = c, a x X +b = 0 para x = (£1, £2, £3) com vetores constantes 
a Æ 0, b e constante c. 
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Resposta: x = Sa + (a x b)/a?. 
3.1.9 Resolva as equações linearesa-.x = d, b - x = e, c - X = f, para X = (£1, £2, £3) com vetores 
constantes a, b, c e constantes d, e, f de modo que (a x b) - c £ 0. 


Resposta: |(a x b) -clx= d(b x c) + e(c x a) + f(a x b). 
3.1.10 Expresse em forma vetorial a solução (x1, £2, %3) de axı + bz2 + cx3 + d = 0 com vetores 
constantes a, b, c, d, de modo que (a x b) -c £ 0. 


3.2 Matrizes 


A análise matricial pertence à álgebra linear porque matrizes são operadores lineares ou mapas, tais como rotações. 
Suponha, por exemplo, que rotacionamos as coordenadas cartesianas de um espaço bidimensional, como na Seção 
1.2, de modo que, em notação vetorial 


e )=( E E Di ) (3.26) 
zh ) À -xasenp+rocosp | = azjzj J` 
Denominamos o arranjo de elementos (Gi! a42) matriz 2 x 2 A consistindo em duas linhas e duas colunas e 
consideramos os vetores x, x’ matrizes 2 x 1. Tomamos o somatório de produtos na Equação (3.26) como uma 
definição de multiplicação de matrizes envolvendo o produto escalar de cada vetor linha de A com o vetor 
coluna x. Assim, em notação matricial, a Equação (3.26) se torna 


1 
x = År. (3.27) 
Para estender essa definição de multiplicação de uma matriz por um vetor coluna ao produto de duas matrizes 
2 x 2, vamos fazer a rotação de coordenadas e, em seguida, uma segunda rotação dada pela matriz B, tal que 


q” = By”. (3.28) 


Em forma de componente, 
HS ES ame (> base) or (3.29) 
j j k k j 
O somatório em relação a j é a multiplicação matricial que define uma matriz C = BA, tal que 


r! = X iktr, (3.30) 
k 


ou x” = Cg em notação matricial. Mais uma vez, essa definição envolve os produtos escalares de vetores linhas de 
B com vetores colunas de A. Essa definição de multiplicação matricial é generalizada para matrizes m x n e é útil; 
na verdade, essa utilidade é a justificativa de sua existência. A interpretação geométrica é que o produto matricial 
das duas matrizes BA é a rotação que leva o sistema “sem linha” diretamente para o sistema de coordenadas 
“duas linhas”. Antes de passarmos para definições formais, você deve notar que o operador A é descrito por seu 
efeito sobre as coordenadas ou vetores de base. Os elementos de matriz a;; constituem uma representação do 
operador, uma representação que depende da escolha de uma base. 

O caso especial de uma matriz de uma só coluna e n linhas é denominado vetor coluna, |x}, com componentes 
zi, i = 1,2,...,n. Se À for uma matriz n x n, |x) um vetor coluna de n componentes, A|x) é definida como 
nas Equações (3.26) e (3.27). De modo semelhante, se uma matriz tiver uma linha e n colunas, é denominada 
vetor linha, (x| com componentes x;, à = 1,2,...,n. Está claro que (x| resulta de |x) pela permutação de 
linhas e colunas, uma operação matricial denominada transposição. A transposição para qualquer matriz A, Ã é 
denominada” “A transposta” com elementos de matriz (Á)ix = Ay; Transpor um produto de matrizes AB inverte 
a ordem e dá BÃ; de modo semelhante, A|x) transposta é (x|A. O produto escalar toma a forma de (xy) = X; tiyi 
(x; em um espaço vetorial complexo. Essa notação “bra-ket” de Dirac é usada extensivamente em mecânica 
quântica e no Capítulo 10, e também passaremos a usá-la aqui. 

De um modo mais abstrato, podemos definir o espaço dual V de funcionais lineares F em um espaço vetorial 
V, em que cada funcional linear F de V atribui um número F (v), de modo que 


F(civi + Covo) = c&F (vı) + c2 F (v2) ; 


6 Alguns textos (incluindo o nosso, às vezes) denotam A transposta por A”. 
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para quaisquer vetores v1, V2 de nosso espaço vetorial V e números c1, c2. Se definirmos a soma de dois funcionais 
por linearidade como 
(Fi + Fo)(v) = Fi (v) + Fa(v), 


então V é um espaço linear por construção. 

O teorema de Riesz diz que há uma correspondência um - para um - entre funcionais lineares F em V e vetores 
f em um espaço vetorial V que tenha um produto interno (ou escalar) (f|v) definido para qualquer 
par de vetores f,v. 

A prova depende do produto escalar por definição de uma funcional linear F para qualquer vetor f de V, tal 
como F(v) = (flv) para qualquer v de V. A linearidade do produto escalar em f mostra que esses funcionais 
formam um espaço vetorial (necessariamente contido em V). Note que um funcional linear é completamente 
especificado quando é definido para todo vetor v de um dado espaço vetorial. 

Por outro lado, partindo de qualquer funcional linear não-trivial F de V, construímos agora um vetor único f 
de V, de modo que F(v) = f - v é dada por um produto interno. Começamos a partir de uma base ortonormal 
w; de vetores em V usando o procedimento de Gram-Schmidt (veja a Seção 3.2). Tome qualquer vetor v de V e 
expanda-o como v = 57, w; : vw;. Então, o funcional linear F(v) = 51, w; : vF'(w;) é bem definido em V. Se 
definirmos o vetor específico f = 57, F(w;)w;, então seu produto interno com um vetor arbitrário v é dado por 
(flv) = f -v = $; F(wi)w: : v = F(v), que prova o teorema de Riesz. 


Definições Básicas 

Uma matriz é definida como um arranjo quadrado ou retangular de números ou funções que obedece a certas leis. 
Essa é um extensão perfeitamente lógica de conceitos matemáticos familiares. Em aritmética lidamos com números 
únicos. Na teoria de variáveis complexas (Capítulo 6) lidamos com pares ordenados de números, (1,2) = 1 + 2i, 
para os quais a ordem é importante. Agora, consideramos números (ou funções) ordenadas em um arranjo quadrado 
ou retangular. Por conveniência, em nosso trabalho mais adiante os números são diferenciados por dois índices 
inferiores (subscritos), sendo que o primeiro indica a linha (horizontal) e o segundo indica a coluna (vertical) na 
qual o número aparece. Por exemplo, a13 é o elemento da matriz na primeira linha, terceira coluna. Por conseguinte, 
se À é uma matriz com m linhas e n colunas, 


a Q12 cr Gin 
a21 Q22 er a2 

A = S : (3.31) 
Am1 Am2 ERAS Amn 


Talvez o fato mais importante a notar é que os elementos a;; não são combinados um com o outro. Uma matriz 
não é um determinante. É um arranjo ordenado de números, não um número único. 

A matriz À, até aqui apenas um arranjo de números, tem as propriedades que a ela atribuímos. Literalmente, 
isso quer dizer construir uma nova forma de matemática. Definimos que matrizes A, B, com elementos a;;, bij, 
respectivamente, se combinam conforme as regras a seguir. 


Ordem 


Voltando às equações lineares homogêneas, Equação (3.1), notamos que a matriz de coeficientes, A, é composta 
de três vetores linhas, sendo que cada um representa uma equação linear do conjunto. Se seu produto escalar triplo 
não for zero, então elas abrangem um volume não-zero e são linearmente independentes, e as equações lineares 
homogêneas têm somente a solução trivial. Nesse caso, diz-se que a matriz é de ordem 3. Em n dimensões o 
volume representado pelo produto escalar triplo torna-se o determinante, det(A), para uma matriz quadrada. Se 
det(A) Æ 0, a matriz n x n matrix A é de ordem n. O caso da Equação (3.1), em que o vetor c encontra-se no 
plano varrido por a e b, por corresponder à ordem 2 da matriz de coeficientes porque somente dois de seus vetores 
linhas a, b, correspondentes a duas equações) são independentes. Em geral, a ordem r de uma matriz é o número 
máximo de vetores linhas ou vetores colunas independentes que ela tem, com 0 < r < n. 


Igualdade 
Matriz A = Matriz B se, e somente se, a;; = b;; para todos os valores de i e j. Isso, é claro, requer que cada uma, 
A e B, seja arranjo m x n (m linhas, n colunas). 


Adição, Subtração 
A+B = C se, e somente se, a;; + bij = cij para todos os valores de i e j, sendo que os elementos são combinados 
conforme as leis da álgebra ordinária (ou da aritmética se forem números simples). Isso significa que 
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A + B = B + A, comutação. Além disso, a lei associativa é satisfeita (A + B) + C = A + (B + C). Se todos os 
elementos são zero, a matriz, denominada matriz nula, é denotada por O. Para toda A, 


A+O=O+A-=A, 


com 
0 00 
0 00 
O = 000 (3.32) 
Essas matrizes m x n formam um espaço linear em relação à adição e à subtração. 
Multiplicação (por um Escalar) 
A multiplicação da matriz A pela quantidade escalar a é definida como 
aA = (aA), (3.33) 


na qual os elementos qA são aa;;; isto é, cada elemento da matriz A é multiplicado pelo fator escalar. Isto é um 
surpreendente contraste com o comportamento de determinantes no qual o fator a multiplica apenas uma coluna 
ou uma linha e não todo elemento do determinante inteiro. Uma conseqiiência dessa multiplicação escalar é que 


aÃ = Aq, comutação. 


Se A for uma matriz quadrada, então 
det(aA) = a” det(A). 


Multiplicação de Matrizes, Produto Interno 
AB=C se, e somente se,” Cij = 5 Qikbkj- (3.34) 
k 


O elemento ij de C é formado como um produto escalar da i-ésima fila de A com a j-ésima coluna de B (o que 
exige que A tenha o número de colunas (n) igual ao número de linhas de B. O índice mudo k assume todos os 
valores 1,2,...,n, sucessivamente; isto é, 


cij = qiabr; + Qizb2j + ai3bsj , (3.35) 


para n = 3. É obvio que o índice mudo k pode ser substituído por qualquer outro símbolo que não esteja em uso 
sem alterar a Equação (3.34). Talvez a situação possa ser esclarecida afirmando que a Equação (3.34) define o 
método de combinar certas matrizes. Para ilustrar que tenha um rótulo, esse método de combinação é denominado 
multiplicação de matrizes. Para ilustrar considere duas matrizes (denominadas matrizes de Pauli): 


n=(1 E] e aslo ep: (3.36) 


O elemento 1; do produto, (o103)11, é dado pela soma dos produtos de elementos da primeira fila de o, com os 
elementos correspondentes da primeira coluna 03: 


0 1 Ñ o E 
( LO )( DO )=oa+m0-0 


ce E (3.37) 


(o O3)ij = On 03; ir O1;20032;* 


Continuando, temos 


Aqui 


7 Aqui, alguns autores seguem a convenção do somatório (compare com a Seção 2.6). 
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A aplicação direta da definição de multiplicação de matrizes mostra que 
0 1 
0301 = ( —1 0 ) (3.38) 


0301 = 0103- (3.39) 


e pela Equação (3.37) 


Exceto em casos especiais, a multiplicação de matrizes não é comutativa:8 
AB £ BA. (3.40) 


Contudo, pela definição de multiplicação de matrizes, podemos mostrar? que uma lei associativa é válida, 
(ABJC = A(BC). Há também uma lei distributiva, A(B + C) = AB + AC. 
A matriz unitária 1 tem elementos ó;;, de Kronecker, e a propriedade de que 1A = A1 = A para todo A, 


0 0 


(3.41) 


II 
Soon 
nooo 


1 0 
01 
0 0 


Deve-se notar que é possível que o produto de duas matrizes seja a matriz nula sem que nenhuma delas seja uma 


matriz nula. Por exemplo, se 
11 1 0 


AB = O. Isso é diferente da multiplicação de números reais ou complexos, que formam um campo, ao passo 
que a estrutura aditiva e multiplicativa de matrizes é denominada anel pelos matemáticos. Veja também o 
Exercício 3.2.6(a), pelo qual fica evidente que, se AB = 0, ao menos uma das matrizes deve ter um determinante 
zero (ou seja, ser singular como definido após a Equação (3.50) nesta seção). 

Se A é uma matriz n x n com determinante |A| 0, então ela tem uma única inversa A”! que satisfaz 
AA! = AT!A = 1. Se B é também uma matriz n x n com inversa B-t, então o produto AB tem a inversa 


(AB)! = pri! (3.42) 


porque ABB +AT! = 1 = B-1A-!AB (veja também Exercícios 3.2.31 e 3.2.32). 

O teorema do produto, que diz que o determinante do produto, |AB|, de duas matrizes A e B é igual ao produto 
dos determinantes, |A||B]|, liga matrizes com determinantes. Para provar isso, considere os n vetores colunas 
ck = È; Gijbjk,i = 1,2,...,n) da matriz produto C = AB para k = 1,2,...,n. Cada ck = Dj Dj hj, 
é uma soma de n vetores colunas aj, = (a;j,,i = 1,2,...,n). Note que agora estamos usando um índice jy 
diferente de somatório de produto para cada coluna c. Uma vez que qualquer determinante D(bjay + boas) = 
bı D(aı) + boD(as) é linear em seus vetores colunas, podemos retirar o sinal de somatório que está na frente do 


determinante de cada vetor coluna em C juntamente com o fator b;, comum da coluna, de modo que 


IC] = se bj, 1bj22 .. bjun det(a; ajz, aee (Aja). (3.43) 
IkS 


Se rearranjarmos os vetores colunas a;, do fator determinante na Equação (3.43) na ordem correta, então podemos 
puxar o fator comum det(a,,as,...,an) = |A] à frente dos n sinais de somatório na Equação (3.43). Essas 
permutações de colunas geram o sinal correto £j; ;,...;, para produzir na Equação (3.43) a expressão presente na 
Equação (3.8) para |B|, de modo que 


CI = JA] $L Ehiz bj dino e: bjaum = JAIB], (3.44) 
ÍkS 


o que prova o teorema do produto. 


8 Comutação, ou falta de comutação, é descrita de modo conveniente pelo símbolo de comutador, o colchete, [A,B] = AB — BA. A 
Equação (3.40) torna-se [A, B] £ 0. 

Note que as definições básicas de igualdade, adição e multiplicação são dadas em termos dos elementos da matriz, os aij. Todas as 
nossas operações matriciais podem ser executadas em termos dos elementos da matriz. Contudo, também podemos tratar uma matriz como um 
operador algébrico único, como na Equação (3.40). Elementos de matrizes e operadores únicos, cada um tem suas vantagens, como veremos 
na próxima seção. Usaremos as duas abordagens. 
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Produto Direto 
Em seguida, apresentamos um segundo procedimento para multiplicar matrizes, conhecido como tensor direto ou 
produto de Kronecker. Se A é uma matriz m x m e B é uma matriz n x n, então o produto direto é 


AgB=C. (3.45) 


C é uma matriz mn x mn com elementos 


Cag = Ai;Bht, (3.46) 


com 
a=m(i—1)+k, B=n(j—1)+1. 


Por exemplo, se A e B forem ambas matrizes 2 x 2 


p a11B a12B 
AnS ( anB a22B ) 


aba @11bi2 ab @12b12 
Es a11b21 aba» aba @12b22 (3.47) 
a21b11 @21b12 @22b11 @22b12 i i 
a21b21 @21b22 a22b21 @22b22 
O produto direto é associativo, mas não comutativo. Como exemplo do produto direto, as matrizes de Dirac 
da Seção 3.4 podem ser desenvolvidas como produtos diretos das matrizes de Pauli e da matriz unitária. Outros 
exemplos aparecem na construção de grupos (veja o Capítulo 4) e em espaço vetorial ou espaço de Hilbert da teoria 
quântica. 


Exemplo 3.2.1 PRODUTO DIRETO DE VETORES 
O produto direto de dois vetores bidimensionais é um vetor de quatro componentes, 


Toyo 


OPORE! 
Tı yı T1Yo 


T1yı 


Zoy0oZo 
ToyYoZ1 
Xoy120 


(2)e(2)e(2)-] 22 | 
Tı yı Z1 T1Y0720 
T1Y021 


T1Y120 
T1y121 


é um vetor de (2º = 8) dimensões. [E] 


Matrizes Diagonais 
Um tipo especial importante de matriz é a matriz quadrada na qual todos os elementos não-diagonais são zero. 
Especificamente, se uma matriz 3 x 3 A for diagonal, então 


11 0 0 
A= 0 a22 0 
0 0 ass 


Uma interpretação física de tais matrizes diagonais e o método para reduzir matrizes a essa forma diagonal são 
considerados na Seção 3.5. Aqui, nos limitamos a destacar uma propriedade significativa de matrizes diagonais — 
a multiplicação de matrizes diagonais é comutativa, 


AB = BA, se cada uma À e B for diagonal. 
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A multiplicação por uma matriz diagonal [dy, d>,..., dn) que tenha somente elementos não-zero na diagonal é 


particularmente simples: 
10 1201 1 2 (1 24. 
0 2 34) \23 2.4) \6 8) 


enquanto a ordem oposta dá 
1 2 1 0\_/122)ħ)_/ù/14 
3 4 02) (3 24) À3 8)’ 


Assim, uma matriz diagonal não comuta com uma outra matriz a menos que ambas sejam diagonais ou que 
a matriz diagonal seja proporcional à matriz unitária. Isso é confirmado pela forma mais geral 


dO > 0 Q11 Q12 ` Qin 
ER a Pu |] Ns 
00 e dn Ani an2 cer Ann 

diam dia diam 

o d2a21 d2a22 doaon 

... . ? 
dnAn1 dnan2 dnann 
enquanto 

Qil Q12 cer Qin dı 0 0 
Aldı, d2,..., dn] = A l o E < : 
Ani An2 ce Ann 00 Ge dn 

diam doar» dnain 

Z dias1 daa922 dnan 

diani d2an2 dnann 


Aqui, denominamos |d1,...,dņ„] a matriz diagonal com elementos diagonais dy,...,d,. No caso especial de 
multiplicação de duas matrizes diagonais, simplesmente multiplicamos os elementos correspondentes da matriz 
diagonal que, obviamente, é comutativa. 


Traço 
Em qualquer matriz quadrada, a soma dos elementos diagonais é denominada traço. 
E claro que o traço é uma operação linear: 


traço(A — B) = traço(A) — traço(B). 


Uma de suas propriedades interessantes e úteis é que o traço de um produto de duas matrizes A e B é independente 
da ordem da multiplicação: 


traço(AB) = > (AB); = É 2 Qijbji 


i 


= 9 D bjiaij => (BA); 


j 


(3.48) 
= traço(BA). 


Isso vale mesmo que AB Æ BA. A Equação (3.48) significa que o traço de qualquer comutador [A, B] = AB — BA 
é zero. Pela Equação (3.48) obtemos 


traço(ABC) = traço(BCA) = traço(CAB), 
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que mostra que o traço é invariante sob permutação cíclica das matrizes em um produto. 

Para uma matriz simétrica real ou uma matriz hermitiana complexa (veja a Seção 3.4), o traço é a soma, e o 
determinante é o produto de seus autovalores e ambos são coeficientes do polinômio característico. No Exercício 
3.4.23 a operação de tomar o traço seleciona um termo de uma soma de 16 termos. O traço servirá a uma função 
semelhante em relação a matrizes, assim como a ortogonalidade serve a vetores e funções. 

Em termos de tensores (Seção 2.7), o traço é uma contração e, assim como o tensor contraído de segunda ordem, 
é um escalar (invariante). 

Matrizes são extensivamente usadas para representar os elementos de grupos (compare com o Exercício 3.2.7 
e o Capítulo 4). Na teoria de grupo, o traço da matriz que representa o elemento de grupo é conhecido como 
caráter. A razão para o nome especial e para a atenção especial é que o traço ou caráter permanece invariante sob 
transformações de similaridade (compare com o Exercício 3.3.9). 


Inversão de Matriz 

No início desta seção, a matriz A é introduzida como a representação de um operador que transforma (linearmente) 
os eixos coordenados. Uma rotação seria um exemplo de tal transformação linear. Agora procuramos a 
transformação inversa A”! que irá restaurar os eixos coordenados originais. Isso quer dizer: como matriz ou como 
equação de operador, !º 


—1 _ —1 = 

i e AAT = AIA =]. (3.49) 
Ed aos: 
as” = Al (3.50) 


sendo Cj; o co-fator (veja a discussão anterior da Equação (3.11)) de a;; e a suposição de que o determinante de 
A, |A| £ 0. Se for zero, é dita singular. Não existe inversa. 

Há uma grande variedade de técnicas alternativas. Uma das melhores e mais comumente usadas é a técnica de 
inversão de matriz de Gauss-Jordan. A teoria é baseada nos resultados dos Exercícios 3.2.34 e 3.2.35, que mostram 
que existem matrizes My, tais que o produto MA será A, mas com 
a. uma fila multiplicada por uma constante ou 
b. uma fila substituída pela fila original menos um múltiplo de uma outra fila ou 
c. filas permutadas. 


Outras matrizes M g operando pela direita a (AM g) podem executar as mesmas operações nas colunas de A. 

Isso quer dizer que as filas e colunas da matriz podem ser alteradas (por multiplicação de matrizes) como se 
estivéssemos lidando com determinantes. Portanto, podemos aplicar as técnicas de eliminação de Gauss-Jordan da 
Seção 3.1 a elementos da matriz. Por conseguinte, existe uma matriz Mz (ou Mx) tal que!! 


MA = 1. (3.51) 


Então, Mz = A”1. Determinamos My executando as operações de eliminação idênticas sobre a matriz unitária. 
Então, 
Mz1 =Mz. (3.52) 


Para esclarecer isso, consideramos um exemplo específico. 


Exemplo 3.2.2 INVERSÃO DE MATRIZ DE GAUSS-JORDAN 
Queremos inverter a matriz 


3 2 1 
A=| 2 31). (3.53) 
1 1 4 
Por conveniência escrevemos A e 1 lado a lado e executamos operações idênticas em cada uma: 
3 2 1 1 0 0 
2 3 1 e 01 0). (3.54) 
1 1 4 0 0 1 


10 Aqui, e em todo este capítulo, nossas matrizes têm ordem finita. Se A for uma matriz de ordem infinita (n x n com n — oo), então a vida 
fica mais difícil. Para que A! seja a inversa, é preciso exigir que 
AM =1 e ATA-1. 
Uma relação não implica mais a outra. 
HLembre-se de que det(A) £ 0. 
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Para sermos sistemáticos, multiplicamos cada linha para obter ax, = 1, 


254.1 1 
e a 30 
31 1 
1 1 4 0 0 
Subtraindo a primeira linha da segunda e da terceira linhas, obtemos 
1 2 1 1 0 0 
3 3 3 
5 1 ds Sd 
1 u 1 
0 353 -3 0 1 


Então dividimos a segunda linha (de ambas as matrizes) por ê e subtraímos 2 vezes ela da primeira linha e 3 


vezes ela da terceira linha. Os resultados para ambas as matrizes são 


10 0 
0 1 5 0 |. (3.57) 
00 1 


= 
olo ole cum 


Dividimos a terceira linha (de ambas as matrizes) por 1, Então, como última etapa, subtraímos 1 vezes a terceira 


E 5 
linha de cada uma das duas primeiras linhas (de ambas as matrizes). Nosso par final é 


11 á ji 
1 0 0 I8 TI JE 
010 e A= 5 H m J- (3.58) 
0 0 1 aiy ES g 

18 18 18 


A verificação é multiplicar a A original pela A”! calculada para ver se realmente obtemos a matriz unitária 1. 


Assim como a solução de Gauss-Jordan para equações algébricas lineares simultâneas, essa técnica se adapta 
bem a computadores. De fato, essa técnica de inversão de matriz de Gauss-Jordan provavelmente constará da 
biblioteca de programas como uma sub-rotina (veja as Seções 2.3 e 2.4 de Press et al., loc. cit.). 

Para matrizes de forma especial, a matriz inversa pode ser dada em forma fechada. Por exemplo, para 


a be 
A= b d b|, (3.59) 
c b e 


a matriz inversa tem uma forma similar, porém ligeiramente mais geral, 


a B J 
ATI = Bi à bə 5 (3.60) 
y b2 € 


com elementos de matriz dados por 


Da = ed — b?, Dy = —(cd — °), DB, = (c — eb, DB, = (c — a)b, 
Dô = ae — c2, De = ad — b?, D=b(2c-a-e)+d(ae— c), 


em que D = det(A) é o determinante da matriz A. Se e = a em A, então a matriz inversa A! também é 
simplificada para 


By = Bo, €=4, D= (a — c)d + 2(c— a)b?. 


Como prova, vamos elaborar o elemento matricial 11 do produto AA! = 1. Encontramos 


1 War 2 
p leled b’) +b°(c— e) — c(cd — b°) | 


1 
= D(— ab! + aed + 2b%e — be- ed) = 


aa + bb + cy = 


S 


ol 
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Do mesmo modo, verificamos que o elemento matricial 12 se anula, 
1 2 
abı + bô + cba = p [able- e) + b(ae — c ) + cb(c— a)| = 0, 


e assim por diante. 

Entretanto, note que nem sempre podemos achar uma inversa de A! resolvendo para os elementos matriciais 
a,b,... de A, porque nem toda matriz inversa A”! da forma que aparece na Equação (3.60) tem uma A 
correspondente da forma especial que aparece na Equação (3.59), como mostra com clareza o Exemplo 3.2.2. 

Matrizes são arranjos quadrados ou retangulares de números que definem transformações lineares, tais como 
rotações de um sistema de coordenadas. Como tal, elas são operadores lineares. Matrizes quadradas podem ser 
invertidas quando seu determinante não for nulo. Quando uma matriz define um sistema de equações lineares, a 
matriz inversa o resolve. Matrizes que têm o mesmo número de linhas e colunas podem ser somadas e subtraídas. 
Elas formam o que os matemáticos denominam anel com uma matriz unitária e uma matriz zero. Matrizes também 
são úteis para representar operações de grupo e operadores em espaços de Hilbert. 


Exercícios 
3.2.1 Mostre que a multiplicação de matrizes é associativa, (AB)C = A(BC). 
3.2.2 Mostre que 
(A + B)(A — B) = A? — B? 
se, e somente se, A e B comutarem, 
[A,B] = 0. 
3.2.3 Demonstre que a matriz A é um operador linear mostrando que 


A(cırı + Cora) = G Arı + co Aro. 


Pode-se mostrar que uma matriz n x n é o operador linear mais geral em um espaço vetorial 
n dimensional. Isso significa que todo operador linear nesse espaço vetorial n dimensional é 
equivalente a uma matriz. 


3.2.4 (a) Números complexos, a + ib, com a e b reais, podem ser representados por (ou são isomórficos 


com) matrizes 2 x 2: 
; ( a b ) 
a+ ib é 
—b a 


Mostre que essa representação matricial é válida para (i) adição e (ii) multiplicação. 
(b) Ache a matriz correspondente (a + ib) 1. 


3.2.5 Se A é uma matriz n x n, mostre que 
det(—-A) = (—1)” det A. 


3.2.6 (a) A equação matricial A? = 0 não implica A = 0. Mostre que a matriz mais geral 2 x 2 cujo 
quadrado é zero pode ser escrita como 


ab b? 
2 , 
—a” —ab 
em que a e b são números reais ou complexos. 


(b) Se C = A + B, em geral 
det C £ det A + det B. 
Construa um exemplo numérico específico para ilustrar essa desigualdade. 
3.2.7 Dadas as três matrizes 


-1 0 01 0 -1 
a a so e Ea 


ache todos os produtos possíveis de A,B e C, dois por vez, incluindo quadrados. Expresse suas 
respostas em termos de A, B e C, e 1, a matriz unitária. Essas três matrizes, juntamente com 
a matriz unitária, formam uma representação de um grupo matemático, o Vierergruppe (veja a 
Capítulo 4). 
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3.2.8 Dada 
0 0 à 
K=| —:: 0 ; 
0 —1 0 
mostre que 
K” = KKK... (n fatores) = 1 
(com a escolha adequada de n, n £ 0). 
3.2.9 Verifique a identidade de Jacobi, 
Isso é útil em descrições matriciais de partículas elementares (veja a Equação (4.16)). Como recurso 
mnemônico, você poderia observar que a identidade de Jacobi tem a mesma forma que a regra 
BAC-CAB da Seção 1.5. 
3.2.10 Mostre que as matrizes 
0 1 0 0 0 0 0 0 1 
A=|0 0 0 |, B=| 0 0 1], C=|0 00 
0 0 0 0 0 0 0 00 
satisfazem as relações de comutação. 
[A,B]=C, [AC=0, e I[Bq=o. 
3.2.11 Seja 
0 1 0 0 0 0 0 -i 
= -1 0 0 0 . |00 -1/0 
“|o ooi CEI 0 0 
0 0 —i 0 1 0 0 0 
e 
0 0 -1 0 
k= 0 0 0 1 
|1 0 0 0 
0 -1 0 0 
Mostre que 
(a) i? = j? = k? = —1, em que 1 é a matriz unitária. 
(b) ij = —ji=k, 
Jk=—k =i, 
ki = —ik =). 
Essas três matrizes (i, j e k) mais a matriz unitária 1 formam uma base para quatérnions. Uma base 
alternativa é dada pelas quatro matrizes 2 x 2 i01, 1092, —io3, 1, em que os sigma são as matrizes 
de spin de Pauli do Exercício 3.2.13. 
3.2.12 Uma matriz com elementos a;; = O para j < i pode ser denominada triangular direita superior. 
Os elementos à esquerda inferior (embaixo e à esquerda da diagonal principal) se anulam. São 
exemplos as matrizes nos Capítulos 12 e 13, Exercício 13.1.21, relativas a séries de potências e 
expansões de autofunções. Mostre que o produto de duas matrizes triangulares superiores direitas é 
uma matriz triangular superior direita. 
3.2.13 As três matrizes de spin de Pauli são 


Mostre que 


(a) (0;)? = 15, 
(b) ojok = io, (j, k,l) = (1, 2,3), (2,3, 1), (3, 1,2) (permutação cíclica), 
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3.2.14 


3.2.15 


3.2.16 


3.2.17 


(c) c;o; + ojo; = 20;;1>; 12 é a matriz 2 x 2 unitária. 
Essas matrizes foram usadas por Pauli na teoria não-relativista de spin do elétron. 


Usando as o; de Pauli do Exercício 3.2.13, mostre que 
(oc-a)(o-b)=a-blz+io-(axb). 


Aqui, 
o=&o+jyo2+tios, 
ae b são vetores ordinários e 15 é a matriz unitária 2 x 2. 


Uma descrição de partículas de spin 1 usa as matrizes 


TOER 
M=- |101], M= 
“lodo 


Mostre que 


(a) [Mz, M,] = iM., e assim por diante!? (permutação cíclica de índices). Usando o símbolo de 
Levi-Civita da Seção 2.9, podemos escrever 


(Mp, Mg] = i€pgr Mr. 


(b) M? = MZ + M? + MZ = 2 13, em que 13 é a matriz unidade 3 x 3. 
(c) [M?, M;] = 0, 

IM., LH] = L+, 

LF; L-] = 2M,, 

em que 

L+ = Me + iMy, 

L- = Mec iM;. 


Repita o Exercício 3.2.15 usando uma representação alternativa, 


00 0 0 0i 
M =| 0 0 |, M=|0 00 
Oi 0 —i 0 0 


0 0 0 


No Capítulo 4 essas matrizes aparecem como os geradores do grupo de rotação. 


Mostre que a equação matricial-vetorial 


19 
M-V+H1Is-> ]4=0 
( e z) y 

reproduz as equações de Maxwell no vácuo. Aqui, % é um vetor coluna com componentes 
p; = Bj; —iE;j/c, j = x,y,z. M é um vetor cujos elementos são as matrizes de momento angular 
do Exercício 3.2.16. Note que copio = 1/c2, 13 é a matriz unitária 3 x 3. 

Do Exercício 3.2.15(b), 

My = 2). 
Uma comparação com a equação relativista de elétrons de Dirac sugere que a “partícula” de 


radiação eletromagnética, o fóton, tem massa de repouso zero e um spin de 1 (em unidades de 
h). 


12[A, B] = AB — BA. 


ELSEVIER 
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3.2.18 


3.2.19 


3.2.20 


3.2.21 


3.2.22 


3.2.23 


Repita o Exercício 3.2.15, usando as matrizes para um spin de 3/2, 


0 v3 0 0 0 -7⁄3 0 0 
a E | us 0 o Se m -| 0 -2 0 
ə] o 2 0 x3 P 2| 0 2 0 -x3’ 
0 0 y3 0 0 å 0 v3 0 
e 

30 0 0 

1f 01 0 0 

M= o o oi ð 

00 0 -3 


Um operador P comuta com J, e Jy, as componentes x e y de um operador de momento angular. 
Mostre que P comuta com a terceira componente do momento angular, isto é, que 


[P,J,]=0. 


Sugestão: As componentes do momento angular devem satisfazer a relação de comutação do 
Exercício 3.2.15(a). 


As matrizes L“ e L” do Exercício 3.2.15 são operadores progressivos (veja o Capítulo 4): L+ 
operando em um sistema de projeção de spin m elevará a projeção de spin para m + 1 se m estiver 
abaixo de seu máximo. L* operando sobre Mmáx dá zero. L” reduz a projeção de spin em etapas 
unitárias de uma maneira semelhante. Dividindo por V2, temos 


0 10 0 00 
E 001], [T=[1 00 
0 0 0 010 
Mostre que 
L+|-1) = |0}, L7|—1) = vetor coluna nulo, 
L*/0) = |1), L70} = |-1), 
L*|1) = vetor coluna nulo, L7 |1) = |0}, 
em que 
0 0 1 
El oO do = 4d, e JO 
1 0 0 


representam estados de projeção de spin —1, 0, e 1, respectivamente. 
Nota: Operadores diferenciais análogos a esses operadores progressivos aparecem no Exercício 
12.6.7. 


Os vetores A e B são relacionados pelo tensor T, 
B=-TA. 


Dados A e B, mostre que não há nenhuma solução única para as componentes de T. É por isso 
que a divisão vetorial B/A é indefinida (à parte o caso especial de A e B paralelos, e T, então um 
escalar). 


Poderíamos pedir um vetor AT 1, um inverso de um dado vetor A no sentido de que 
AAA T.A-I. 


Mostre que essa relação não é suficiente para definir A”! unicamente; então, A teria um número 
infinito de inversos. 


Se A é uma matriz diagonal, com todos os elementos diagonais diferentes, e A e B comutam, mostre 
que B é diagonal. 
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3.2.24 
3.2.25 
3.2.26 


3.2.27 


3.2.28 


3.2.29 


3.2.30 


3.2.31 
3.2.32 


3.2.33 


3.2.34 


3.2.35 


3.2.36 


Se A e B são diagonais, mostre que A e B comutam. 
Mostre que o traço (ABC) = traço(CBA) se qualquer das três matrizes comutam. 


Matrizes de momento angular satisfazem uma relação de comutação 
M;, My] = iM,, j, k,l cíclicos. 


Mostre que o traço de cada matriz de momento angular se anula. 


(a) O operador traço substitui uma matriz A por seu traço; isto é, 
traço(A) = 5 Gii. 
i 


Mostre que o traço é um operador linear. 
(b) O operador det substitui uma matriz A por seu determinante; isto é, 


det(A) = determinante de A. 


Mostre que det não é um operador linear. 


A e B anticomutam: BA = —AB. Além disso, A? = 1, B? = 1. Mostre que traço(A) = 
traço(B) = 0. 
Nota: As matrizes de Pauli e Dirac (Seção 3.4) são exemplos específicos. 


Sendo |x) um vetor coluna N dimensional e (y| um vetor linha N dimensional, mostre que 


traço(|æ) (y|) = (ylz). 
Nota: |x) (y| significa produto direto de vetor coluna |x} com vetor (y|. O resultado é uma matriz 
quadrada N x N. 


(a) Se duas matrizes não-singulares anticomutarem, mostre que o traço de cada uma é zero. Não- 
singular significa que o determinante da matriz é não-zero. 

(b) Para que as condições da parte (a) sejam válidas, A e B devem ser matrizes n x n com n par. 
Mostre que, se n for ímpar, resulta uma contradição. 

Se uma matriz tiver uma inversa, mostre que a inversa é única. 


Se A”! tem elementos 


==1 LD o Cji 
(A Dj = ER, AT? 


em que C}; é o co-fator de ordem ji de |A|, mostre que 
ATA =1. 


Por conseqiiência, se A7! é a inversa de A (if |A| £ 0). 

Mostre que det A! = (det A) 1. 

Nota: Se det A é zero, então A não tem nenhuma inversa. A é singular. 

Ache as matrizes My, tais que o produto Mz A será A, porém com: 

(a) a i-ésima linha multiplicada por uma constante k (aij — kaij, j = 1,2,3,...); 

(b) a à-ésima linha substituída pela i-ésima linha original, menos um múltiplo da m-ésima linha 
(aij > aij — Kamj, i= 1,2,3,...); 

(c) a i-ésima e a m-ésima linhas permutadas (aij > amj, amj — tij, j = 1,2,3,...). 

Ache as matrizes Mx, tais que o produto AM será A, porém com 

(a) (a) a i-ésima coluna multiplicada por uma constante k (aj; — kaji, j = 1,2,3,...); 

(b) a i-ésima coluna substituída pela i-ésima coluna original, menos um múltiplo da m-ésima 
coluna (aji > aji — kajm,j = 1,2,3,...): 

(c) a i-ésima e a m-ésima colunas permutadas (aji > ajm, Lim > aji, j = 1, 2, 3, ...). 


Ache a inversa de 


3 2 1 
A=|2 2 1 
1 1 4 
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3.2.37 


3.2.38 


3.2.39 


3.2.40 


3.2.41 


3.2.42 


3.2.43 


(a) Reescreva a Equação (2.4) do Capítulo 2 (e as equações correspondentes para dy e dz) como 
uma única equação matricial 


J é uma matriz de derivadas, a matriz jacobiana. Mostre que 
(dep|dar) = (dai]Gldg;), 


sendo que a (matriz) métrica G tem elementos g;; dados pela Equação (2.6). 
(b) Mostre que 
det(J) dqı dgs dgz = dz dy dz, 


sendo det(J) o Jacobiano usual. 


Matrizes têm uma utilidade muito grande para permanecer como propriedade exclusiva dos físicos. 
Elas podem aparecer onde quer que haja relações lineares. Por exemplo, em um estudo de 
movimento populacional, a fração inicial de uma população fixa em cada uma das n áreas (ou 
indústrias ou religiões etc.) é representada por um vetor coluna de n componentes P. O movimento 
de pessoas de uma área para outra em um tempo dado é descrito por uma matriz (estocástica) n x n 
T. Aqui, T;; é a fração da população na j-ésima área que passa para a i-ésima área. (As frações 
que não passam são cobertas por 1 = j.) Com P descrevendo a distribuição inicial da população, a 
distribuição final da população é dada pela equação matricial TP = Q. 

Por essa definição, >, P; = 1. 


(a) Mostre que a conservação de pessoas requer que 


= ER! engi 
i=1 


(b) Prove que 


preserva a conservação de pessoas. 


Dada uma matriz A 6 x 6 com elementos a;; = 0.5, i = 0,1,2,...,5; i=0,1,2,...,5, ache 
Ar. Liste seus elementos matriciais até a quinta casa decimal. 


1 
Resposta: AT! = E 


SS: OS: 


O Exercício 3.1.7 pode ser escrito sob forma de matriz: 
AX =C. 


Ache A”! e calcule X como AIC. 


(a) Escreva uma sub-rotina que multiplicará matrizes complexas. Admita que as matrizes 
complexas estão em uma forma geral retangular. 
(b) Teste sua sub-rotina multiplicando pares das matrizes 4 x 4 de Dirac, Seção 3.4. 


(a) Escreva uma sub-rotina que chamará a sub-rotina de multiplicação de matrizes complexa do 
Exercício 3.2.41 e calculará o comutador bracket das duas matrizes complexas. 
(b) Teste sua sub-rotina de comutador bracket complexo com as matrizes do Exercício 3.2.16. 


Polinômio interpolador é o nome dado ao polinômio de grau (n — 1) determinado por (e que passa 
através de) n pontos, (xi, yi) com todos os x; distintos. Esse polinômio interpolador forma uma 
base para quadraturas numéricas. 
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(a) Mostre que exigir que um polinômio de grau (n — 1) em x passe por cada um dos n pontos 
(£i, yi) com todos os x; distintos resulta em n equações simultâneas da forma 


n—l 


j = Riscos 
) aajt} = Yi, vcs 
J=0 


(b) Escreva um programa de computador que lerá n pontos de dados e retornará os n coeficientes 
aj. Se houver uma sub-rotina disponível, use-a para resolver equações simultâneas. 
(c) Reescreva o conjunto de equações simultâneas como uma equação matricial 


XA =Y. 


(d) Repita o cálculo de computador da parte (b), mas, desta vez, resolva para o vetor A invertendo 
a matriz X (novamente, usando uma sub-rotina). 


3.2.44 Um cálculo dos valores de potencial eletrostático dentro de um cilindro leva a 


V (0,0) = 52,640 V(0,6) = 25,844 
V (0,2) = 48,292 V(0,8) = 12,648 
V(0,4) = 38,270 V(1,0) = 0.0. 


O problema é determinar os valores do argumento para o qual V = 10, 20, 30, 40 e 50. Expresse 
V(x) como uma série Sa anx”. (Requisitos de simetria do problema original exigem que 
V(x) seja uma função par de x.) Determine os coeficientes asn. Agora que V(x) é uma função 
conhecida de x, ache a raiz de V(x) — 10 = 0,0 < x < 1. Repita para V(x) — 20, e assim por 
diante. 
Resposta: ao = 52,640, 
az = —117, 676, 
V (0,6851) = 20. 


3.3 Matrizes Ortogonais 


O espaço tridimensional ordinário pode ser descrito com as coordenadas cartesianas (£1, £2, £3). Consideramos 
um segundo conjunto de coordenadas cartesianas (14, 14, £3), cuja origem e orientação (para a direita ou para a 
esquerda) coincidem com as do primeiro conjunto, mas cuja orientação é diferente (Figura 3.1). Podemos dizer 
que os eixos coordenados “com linha” foram rotacionados em relação aos eixos coordenados iniciais, “sem linha”. 
Uma vez que essa rotação é uma operação linear, esperamos uma equação matricial que relacione a base “com 
linha”com a base “sem linha”. 

Esta seção repete partes dos Capítulos 1 e 2 em um contexto ligeiramente diferente e com uma ênfase diferente. 
Antes, a atenção estava voltada para vetor ou tensor. No caso do tensor, as propriedades de transformação eram 
fortemente destacadas e muito críticas. Aqui a ênfase recai sobre a descrição da rotação de coordenadas em si — a 
matriz. Propriedades de transformação, o comportamento da matriz quando a base é trocada, aparecem no final 
desta seção. As Seções 3.4 e 3.5 continuam com propriedades de transformação em espaços vetoriais complexos. 


Co-senos Diretores 


Um vetor unitário ao longo do eixo x (%) pode ser decomposto em componentes ao longo dos eixos £1, £2 € £3 
pela técnica usual de projeção: 


$i = & cos(x£1, £1) + R2 cos(1],12) + X3 cos(x4, £3). (3.61) 


A Equação (3.61) é um exemplo específico das relações lineares discutidas no início da Seção 3.2. 
Por conveniência, esses co-senos, que são os co-senos direcionais, são rotulados 


cos(x}, 11) = R $ &1 = 1; 
cos(x}, £2) = $i : Šo = 012; (3.62a) 
cos(x, £3) = $ E X3 = 013. 
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Figura 3.1: Sistemas de coordenadas cartesianas. 


Continuando, temos 


À EF A, 
cos(x5,%1) = f3 -X1 = a21, 
i RIAA (3.62b) 
cos(£3, £2) = Ra - R2 = 99; 
e assim por diante, em que a21 # a12 em geral. Agora, a Equação (3.62) pode ser reescrita como 
a a z à 
R1 = 1011 + 2012 + 3413, (3.62c) 
e também 
R3 = R1021 + R2022 + R3023 
E A K ; (3.62d) 
X3 = X1031 T X2032 T X34033. 


Também podemos seguir por outro caminho resolvendo %1, X2 e %3 em componentes no sistema “com linha”. 
Então 


s SI S/ SI 
X1 = X111 T X2021 T X34031, 


S aI aI aI 
X2 = X11412 ap X24022 ap X34032, (3.63) 


X3 = $i a13 si R9a23 Ir $% azz. 
Associando $; e Xj com o índice inferior 1, X e 4 com o índice inferior 2, Ša e X com o índice inferior 
3, vemos que em cada caso o primeiro índice inferior de a;; refere-se ao vetor unitário “com linha” (1,3%, 83), 
enquanto o segundo índice inferior se refere ao vetor unitário “sem linha” ($1, X2,X3). 


Aplicações a Vetores 
Se considerarmos um vetor cujas componentes são funções da posição no espaço, então 


V (z1, £2, £3) = R1 Vi + &oVo + 3V3, 


1 
a x A .64 
V' (21,22,23) = 84 V] + R3V3 + 33 V3, Sa 
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uma vez que o ponto pode ser dado tanto pelas coordenadas (x1, £2, £3) quanto pelas coordenadas (24, 14, £3). 
Note que, em termos geométricos, V e V’ são o mesmo vetor (porém com componentes diferentes). Os eixos 
coordenados estão sendo rotacionados; o vetor permanece fixo. Usando as Equações (3.62) para eliminar %1, R2 e 
X3, podemos decompor a Equação (3.64) em três equações escalares, 

Vi = a11 Vı + a12 V2 + a13V3, 

Vz = a21 Vı + a22V2 + a23 V3, (3.65) 

V3 = azı Vı + a32 V2 + azz V3. 


Em particular, essas relações serão válidas para as coordenadas de um ponto (£1, £2, £3) e (£4, £5, £h), dando 
, 143 1233: 


Tı = Q111 T Q412%2 T A1373, 


, 
Lo = G21%1 T A222 + do3L3; (3.66) 


8 
[o 
I 


Q31%1 T Agala T A3313, 


e, de modo semelhante, para as coordenadas “com linha”. Com essa notação o conjunto das três Equações (3.66) 
pode ser escrito como 


3 
=D age, (3.67) 
j=1 


em que à assume os valores 1,2 e 3 e o resultado são três equações separadas. 

Agora vamos deixar de lado esses resultados e tentar uma abordagem diferente para o mesmo problema. 
Consideramos dois sistemas de coordenadas (x1, £2, £3) e (x1, £5, 14) com uma origem comum em um ponto 
(£1, £2, £3) no sistema “sem linha”, (74,25, £4) no sistema “com linha”. Note a ambigiiidade usual. O mesmo 
símbolo x denota o eixo coordenado e também uma distância particular ao longo desse eixo. Uma vez que nosso 
sistema é linear, x; deve ser uma combinação linear do x; . Seja 


3 
£, = ads (3.68) 
j=i 


Os a;; podem ser identificados como os co-senos diretores. Mais adiante essa identificação é efetuada para o caso 
bidimensional. 

Se tivermos dois conjuntos de quantidades (Vi, V2, V3) no sistema sem linha e (Vi, V3, V3) no sistema com 
linha, relacionados da mesma forma que as coordenadas de um ponto em dois sistemas diferentes (Equação (3.68)), 


3 
V! =X aV, (3.69) 
j=1 


então, assim como na Seção 1.2, as quantidades (V1, V2, V3) são definidas como as componentes de um vetor que 
permanece fixo enquanto as coordenadas sofrem rotação; isto é, um vetor é definido em termos de propriedades de 
transformação de suas componentes sob uma rotação dos eixos coordenados. Em certo sentido, as coordenadas de 
um ponto foram usadas como vetor representativo. A eficiência e a utilidade dessa definição ficaram aparentes no 
capítulo 2, em que ela foi estendida para definir pseudovetores e tensores. 

Pela Equação (3.67) podemos derivar informações interessantes sobre os a;; que descrevem a orientação do 
sistema de coordenadas (14,4, 1%) em relação ao sistema (£1, £2, £3). O comprimento desde a origem até o 
ponto é o mesmo em ambos os sistemas. Elevando ao quadrado, por conveniência, ! 


DAD a ayas) 2 cute) 


i 
= ) Tjtk ) Qijaik. (3.70) 
j,k i 
Essa expressão pode valer para todos os pontos se, e somente se, 


> Qijaik = jk» j,k = 1,2,3. (3.71) 


Note que são usados dois índices independentes: j e k. 
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Note que a Equação (3.71) é equivalente à equação matricial (3.83); veja também as Equações (3.87a) até (3.87d). 

A verificação da Equação (3.71), se necessária, pode ser obtida voltando à Equação (3.70) e estabelecendo 
r = (z1,£2,£3) = (1,0,0),(0,1,0), (0,0,1),(1,1,0), e assim por diante, para avaliar as nove relações dadas 
pela Equação (3.71). Este processo é válido, já que a Equação (3.70) deve ser válida para todos os r para um 
dado conjunto de a;;. A Equação (3.71), uma consegiiência de se exigir que o comprimento permaneça constante 
(invariante) sob rotação do sistema de coordenadas, é denominada condição de ortogonalidade. Os a;;, escritos 
como uma matriz A sujeita à Equação (3.71), formam uma matriz ortogonal, uma primeira definição de uma 
matriz ortogonal. Note que a Equação (3.71) não é multiplicação de matrizes. Mais exatamente, é interpretada 
mais adiante como um produto escalar de duas colunas de A. 

Em notação matricial, a Equação (3.67) se torna 


|x") = Alx). (3.72) 


Figura 3.2: Rotação de coordenadas. 


Condições de Ortogonalidade — Caso Bidimensional 
Podemos entender melhor os a;; e a condição de ortogonalidade considerando mais detalhadamente a rotação em 
duas dimensões (que pode ser imaginada como um sistema tridimensional com os eixos 74, x2 rotacionados ao 
redor de x3). Pela Figura 3.2, 

xi = T1 COS Y + xosen Y, 


; (3.73) 
Lə = —T18SEN Y + T2 COS Y. 
Portanto, pela Equação (3.72) 
A= ( SERE ENS ) . (3.74) 
—seny cosy 


Note que A se reduz à matriz unitária para y = 0. Um ângulo de rotação zero significa que nada mudou. Fica claro 
pela Figura 3.2 que 


a11 = cosy = cos(x), x1) 


ai2 = sen Y = cos( Ẹ§ — p) = cos(x1, £2), (a 


e assim por diante, identificando os elementos matriciais a;; como os co-senos diretores. A Equação (3.71), a 
condição de ortogonalidade, se torna 


sen? p + cos’ p =1, (3.76) 
sen y cos y — sen y cos y = 0. 
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A extensão para três dimensões (rotação das coordenadas através de um ângulo y em sentido anti-horário ao 
redor de x3) é simplesmente 
cosy seny 0 
A= | -seny cosy O |. (3.77) 
0 0 1 


O a33 = 1 expressa o fato de que z4 = x3, uma vez que a rotação foi executada ao redor do eixo x3. Os zeros 
garantem que «4 e x4 não dependem de x3 e que «x não depende de z1 e z2. 


Matriz Inversa A”! 
Voltando à matriz de transformação geral A, a matriz inversa A”! é definida de modo tal que 


|£) = Ata”). (3.78) 


Isto é, A”! descreve o inverso da rotação dada por A e retorna o sistema coordenado à sua posição original. 
Simbolicamente, as Equações (3.72) e (3.78) se combinam e resultam em 


lx) = ATtA|x), (3.79) 
e, uma vez que |x) é arbitrário, 
ATA =1, (3.80) 
a matriz unitária. De modo semelhante, 
AAT! =1, (3.81) 


usando as Equações (3.72) e (3.78) e eliminando |x} em vez de |x’). 


Matriz Transposta, A 

Podemos determinar os elementos de nossa matriz inversa postulada AT! utilizando a condição de ortogonalidade. 
A Equação (3.71), a condição de ortogonalidade, não está de acordo com nossa definição de multiplicação de 
matrizes, mas pode ser colocada na forma requerida definindo-se uma nova matriz Á, tal que 


dji = Qij. (3.82) 


A Equação (3.71) se torna 


ÃA = 1. (3.83) 


Esta é uma reafirmação da condição de ortogonalidade e pode ser tomada como a restrição que define uma matriz 
ortogonal, uma segunda definição de uma matriz ortogonal. Multiplicando a Equação (3.83) por AT! partindo da 
direita e usando a Equação (3.81), temos 


=A}, (3.84) 


uma terceira definição de matriz ortogonal. Esse resultado importante, isto é, a inversa é igual à transposta, vale 
somente para matrizes ortogonais e, na verdade, pode ser tomado como mais uma reafirmação da condição de 


ortogonalidade. 
Multiplicando a Equação (3.84) por A partindo da esquerda, obtemos 
AÃ=1 (3.85) 
ou 
Do aja = Og, (3.86) 


que é mais outra forma da condição de ortogonalidade. 
Resumindo, a condição de ortogonalidade pode ser enunciada de vários modos equivalentes: 


5 Qijüik = Îjk, (3.87a) 
5 Ajilki = Îjk, (3.87b) 
AA=AÃ=1, (3.870) 


À =A. (3.87d) 
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Qualquer dessas relações é um condição necessária e suficiente para que A seja ortogonal. 
Agora é possível ver e entender por que o termo ortogonal é adequado para essas matrizes. Temos a forma geral 


Q11 Q12 Q13 
A= a21 Q22 Q23 , 


uma matriz de co-senos direcionais na qual a;; é o co-seno do ângulo entre xi e £j. Por conseqüência, a11, a12, 
aı3 são as direções dos co-senos de x relativas a z1, £2, £3. Esses três elementos de A definem uma unidade de 
comprimento ao longo de «4, isto é, um vetor unitário X/, 


Al a a N 
X, = X1011 + X2012 + X34013. 


A relação de ortogonalidade (Equação (3.86)) é simplesmente uma afirmação de que os vetores unitários X/, X4 
e $% são mutuamente perpendiculares ou ortogonais. Nossa matriz de transformação ortogonal A transforma um 
sistema de coordenadas ortogonal em um segundo sistema de coordenadas ortogonal por rotação e/ou reflexão. 

Como um exemplo do uso de matrizes, os vetores unitários em coordenadas polares esféricas podem ser escritos 
como 


=C (3.88) 


NY“ O 


E Dre 


em que C é dado no Exercício 2.5.1. Essa expressão é equivalente às Equações (3.62) com x4, x4 e x4 substituídos 
por f, O e œ. Pela análise precedente, C é ortogonal. Por conseguinte, a relação inversa se torna 


= C7! (3.89) 


Ere 
II 
(@) 
EDI 


N < O> 


e o Exercício 2.5.5 é resolvido por inspeção. Aplicações similares de matrizes inversas aparecem em conexão com a 
transformação de uma série de potências para uma série de funções ortogonais (ortogonalização de Gram-Schmidt 
na Seção 10.3) e com a solução numérica de equações integrais. 


A 
Angulos de Euler 

Nossa matriz de transformação A contém nove co-senos diretores. É claro que somente três deles são 
independentes, sendo que a Equação (3.71) provê seis restrições. De modo equivalente, podemos dizer que 
são necessários dois parâmetros (0 e « coordenadas polares esféricas) para fixar o eixo de rotação. Então, um 
parâmetro adicional descreve a quantidade de rotação ao redor do eixo especificado. (Na formulação lagrangiana 
da mecânica (Seção 17.3) é necessário descrever A usando algum conjunto de três parâmetros independentes em 
vez dos co-senos diretores redundantes). A escolha usual de parâmetros são os ângulos de Euler.!* 

O objetivo é descrever a orientação de um sistema rotacionado final (x, £4’, £3’) relativa a algum sistema 
coordenado inicial (x1, £2, £3). O sistema final é desenvolvido em três etapas, sendo que cada uma delas envolve 
uma rotação descrita por um ângulo de Euler (Figura 3.3): 

1. As coordenadas são rotacionadas ao redor do eixo x3 através de um ângulo a em sentido anti-horário até os 
novos eixos denotados por 14, 14, 14. (Os eixos x3 e x% coincidem.) 

2. As coordenadas são rotacionadas ao redor do eixo x4.!º Através de um ângulo 8 em sentido anti-horário até os 
novos eixos denotados por x7, xy, x3. (Os eixos x e x% coincidem.) 

3. A terceira e última rotação é através de um ângulo y em sentido anti-horário ao redor do eixo «7, resultando no 


sistema x”, 25", £3’. (Os eixos x4 e x3’ coincidem.) 


As três matrizes que descrevem essas rotações são 
cosa sena O 


Ri(o)= | -sena cosa 0 |, (3.90) 
0 0 1 


Há quase tantas definições de ângulos de Euler quanto autores. Aqui seguimos a opção que costuma ser adotada pelos que trabalham nas 
áreas da teoria de grupo e da teoria quântica do momento angular (compare com as Seções 4.3 e 4.4). 
!5 Alguns autores escolhem esta segunda rotação ao redor do eixo E 
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E 
brhi de nós 
c 


Figura 3.3: (a) Rotação ao redor de z3 através do ângulo a; (b) Rotação ao redor de «x4 através do ângulo 8; (c) 
Rotação ao redor de x% através do ângulo y, 


exatamente como a Equação (3.77), 


cos8 O -—sen 8 
Ry(8) = 0 1/0 (3.91) 
sen O cosf 


e 
cosy seny 0 
R-(y)= | —seny cosy 0 |. (3.92) 
0 0 1 
A rotação total é descrita pelo produto matricial triplo, 
A(a, 8,7) = Re(W)Ry(B)Rela). (3.93) 


Note a ordem: R.(a) opera em primeiro lugar, em seguida, R,(/5) e, por fim, R.(7). A multiplicação direta 
resulta 


A(a, 8,7) 


cos y cos 8 cos œ — sen ysena cosycosfsena+senycosa — cos ysen 5 
= | —sen y cos ĝ cos a — cos ysen œ —sen y cos sen a + cos ycosœ sen ysen 8 
sen 8 cos a sen sen a cos 8 
(3.94) 


Igualar A(a;;) a A(a, 3,7), elemento por elemento, resulta nos co-senos direcionais em termos dos três ângulos de 
Euler. Poderíamos usar essa identificação do ângulo de Euler para verificar as identidades dos co-senos direcionais, 
Equação (1.46) da Seção 1.4, mas a abordagem do Exercício 3.3.3 é muito mais elegante. 


Propriedades de Simetria 
Nossa descrição de matriz leva ao grupo de rotação SO(3) no espaço tridimensional Rê, e a descrição de rotações 
por ângulos de Euler forma uma base para o desenvolvimento do grupo de rotação no Capítulo 4. Rotações também 
podem ser descritas pelo grupo unitário SU(2) em espaço bidimensional C? sobre os números complexos. O 
conceito de grupos como SU(2) e suas generalizações e técnicas teóricas de grupo são encontrados com fregiiência 
na moderna física de partículas, em que propriedades de simetria desempenham um importante papel. O grupo 
SU(2) também é considerado no Capítulo 4. O poder e a flexibilidade das matrizes condenaram os quatérnions à 
obscuridade no início do século XX.!6 

Devemos observar que as matrizes foram tratadas de duas maneiras na discussão anterior: por seus componentes 
e como entidades separadas. Cada técnica tem suas próprias vantagens e ambas são úteis. 

A matriz transporta é útil para uma discussão de propriedades de simetria. Se 


A= A, Qij = Aji, (3.95) 
a matriz é denomina simétrica, enquanto, se 


A= —A, Qij = — aji, (3.96) 


I6R, J. Stephenson, “Development of vector analysis from quaternions”. Am. J. Phys. 34: 194 (1966). 
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ela é denominada anti-simétrica ou simétrica deslocada. Os elementos da diagonal desaparecem. É fácil mostrar 
que qualquer matriz (quadrada) pode ser escrita como a soma de uma matriz simétrica e uma matriz anti-simétrica. 
Considere a identidade 

A = Ł[A + Ã] + Ł[A — À]. (3.97) 


[A + A] é claramente simétrica, ao passo que [A — À] é claramente anti-simétrica. Esta é a matriz análoga à 
da Equação (2.75), Capítulo 2, para tensores. De maneira semelhante, uma função pode ser subdividida em suas 
partes: par e ímpar. 

Até aqui interpretamos a matriz ortogonal como rotação do sistema de coordenadas. Isso altera as componentes 
de um vetor fixo (que não sofre rotação com as coordenadas (Figura 1.6, Capítulo 1). Contudo, uma matriz 
ortogonal A pode ser interpretada igualmente bem como uma rotação do vetor na direção oposta (Figura 3.4). 

Essas duas possibilidades — (1) rotacionar o vetor mantendo as coordenadas fixas e (2) rotacionar as coordenadas 
(no sentido contrário) mantendo o vetor fixo — têm uma analogia direta na teoria quântica. A rotação (uma 
transformação de tempo) do vetor de estado dá o quadro de Schrödinger. A rotação da base mantendo o vetor 
de estado fixo resulta no quadro de Heisenberg. 


y 


Figura 3.4: Coordenadas fixas — vetor rotacionado. 


Suponha que interpretemos a matriz A como rotacionando um vetor r até a posição mostrada por r1; isto é, em 
um sistema coordenado particular temos uma relação 


rı = Ar. (3.98) 


Agora, vamos rotacionar as coordenadas aplicando a matriz B, que rotaciona (x, y, z) para (x',y',2'), 


ri = Br, = BAr = (Ar) = BA(B”!'B)r 
= (BAB NBr = (BAB Jr”. (3.99) 


Br; é exatamente rı no novo sistema de coordenadas, sendo que uma interpretação similar é válida para Br. Daí, 
neste novo sistema (Br), é rotacionada até a posição (Br) pela matriz BAB”!: 


No novo sistema as coordenadas foram rotacionadas pela matriz B; A tem a forma A’, na qual 


A' = BAB 1. (3.100) 
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A" opera em espaço x”, y’, z’, assim como A opera em espaço x, y, z. 
A transformação definida pela Equação (3.100), sendo B qualquer matriz, não necessariamente ortogonal, é 
conhecida como transformação de similaridade. Na forma de componentes, a Equação (3.100) torna-se 


dis S braB y (3.101) 
k,l 
Agora, se B é ortogonal, i 
(BD, = (By = bj, (3.102) 
e temos 
al; => Dbinbjan- (3.103) 
k,l 


Talvez seja útil pensar em A novamente como um operador, possivelmente como eixos coordenados em rotação, 
relacionando momento angular e velocidade angular de um sólido em rotação (Seção 3.5). A matriz A é a 
representação de um dado sistema coordenado ou base. Mas há direções associadas com A — eixos dos cristais, 
eixos de simetria no sólido em rotação, e assim por diante —, de modo que a representação A depende da base. A 
transformação de similaridade mostra exatamente como a representação que se altera muda com uma mudança da 
base. 


Relação com Tensores 
Comparando a Equação (3.103) com as equações da Seção 2.6, vemos que ela é a definição de um tensor de 
segunda ordem. Daí, uma matriz que se transforma por uma transformação de similaridade ortogonal é, por 
definição, um tensor. Então, é claro que qualquer matriz ortogonal A, se interpretada como rotacionando um 
vetor (Equação (3.98)), pode ser denominada tensor. (Contudo, se considerarmos a matriz ortogonal como 
uma coleção de co-senos direcionais fixos, dando a nova orientação de um sistema coordenado, não há nenhuma 
propriedade de tensor envolvida. 

As propriedades de simetria e anti-simetria definidas antes são preservadas sob transformações de similaridade 
ortogonais. Seja A uma matriz simétrica, A = Ãe 


A' = BAB” |. (3.104) 


Agora, º e E 
A' = B-!AB = BAB™}, (3.105) 
visto que B é ortogonal. Mas A = À. Por conseguinte, 


A'=BAB !=A', (3.106) 


mostrando que a propriedade de simetria é invariante sob uma transformação de similaridade ortogonal. Em geral, 
a simetria não é preservada sob uma transformação de similaridade não-ortogonal. 


Exercícios 
Nota: Admita que todos os elementos matriciais sejam reais. 


3.3.1 Mostre que o produto de duas matrizes ortogonais é ortogonal. 
Nota: Esta é uma etapa fundamental para demonstrar que todas as matrizes ortogonais n x n formam 
um grupo (Seção 4.1). 


3.3.2 Se A é ortogonal, mostre que seu determinante = +1. 

3.3.3 Se A é ortogonal e det A = +1, mostre que (det AJa;; = Cij, em que C;; é o co-fator de a;;. 
Isso dá como resultado as identidades da Equação (1.46), usadas na Seção 1.4 para mostrar que um 
produto cruzado de vetores (em espaço tridimensional) é, ele mesmo, um vetor. 

Sugestão: Note o Exercício 3.2.32. 


3.3.4 Um outro conjunto de rotações de Euler de uso comum é 


(1) uma rotação ao redor do eixo x3 por meio de um ângulo (p, em sentido anti-horário, 
2) uma rotação ao redor do eixo x” por meio de um ângulo 0, em sentido anti-horário, 
1 
E Soi f A : i-horário. 
3) uma rotação ao redor do eixo x4 por meio de um ângulo 1), em sentido anti-horário 
Se 
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a=y-—7m/2 p=a+7r/2 
8=0 o= 
y=¢p+7r/2 b=y-7n/2, 


3.3.5 


3.3.6 


3.3.7 


3.3.8 
3.3.9 
3.3.10 


3.3.11 


3.3.12 


3.3.13 


3.3.14 


3.3.15 


3.3.16 


mostre que os sistemas finais são idênticos. 


Suponha que a Terra se mova (seja rotacionada) de modo que o pólo norte passe para a posição 
30° norte, 20° oeste (sistema original de latitude e longitude) e que o meridiano 10° aponte para a 
direção sul. 


(a) Quais são os ângulos de Euler que descrevem essa rotação? 
(b) Ache os co-senos direcionais correspondentes. 
0,9551 —0,2552 —0, 1504 
Resposta: (b) A = | 0,0052 0,5221 —0, 8529 
0,2962 0,8138 0, 5000 
Verifique que a matriz de rotação do ângulo de Euler, Equação (3.94), é invariante sob a 
transformação 
“a Âu4+7, 8 > —B, VPN. 


Mostre que a matriz de rotação do ângulo de Euler A(a, 8, y) satisfaz as seguintes relações: 

(a) Aa, 8,9) = A(a, 8,7), 

(b) Ata, 8,7) = A(-,—8,-0). 

Mostre que o traço do produto de uma matriz simétrica por uma matriz anti-simétrica é zero. 
Mostre que o traço de uma matriz permanece invariante sob transformações de similaridade. 
Mostre que o determinante de uma matriz permanece invariante sob transformações de similaridade. 


Nota: Os Exercícios 3.3.9 e 3.3.10 mostram que o traço e o determinante são independentes das 
coordenadas cartesianas. Eles são característicos da matriz (operador) em si. 


Z 


Mostre que a propriedade de anti-simetria é invariante sob transformações de similaridade 
ortogonais. 


A é 2 x 2 e ortogonal. Ache a forma mais geral de 
a b 
E 


|x) e |y) são vetores colunas. Sob uma transformação ortogonal S, |x) = S|x), |y) = Sly). 
Mostre que o produto escalar (x | y) é invariante sob essa transformação ortogonal. 
Nota: Isso é equivalente à invariância do produto escalar de dois vetores, Seção 1.3. 


Compare com a rotação bidimensional. 


Mostre que a soma dos quadrados dos elementos de uma matriz permanece invariante sob 
transformações de similaridade ortogonais. 


Como uma generalização do Exercício 3.3.14, mostre que 
Dee = X SimTim: 
jk l,m 


em que os elementos “com linha” e “sem linha” são relacionados por uma transformação de 
similaridade ortogonal. Esse resultado é útil para derivar invariantes em teoria eletromagnética 
(compare com a Seção 4.6). 

Nota: Esse produto M;, = yo SjkTjk às vezes é denominado produto de Hadamard. Na estrutura 
da análise tensorial, Capítulo 2, este exercício torna-se uma contração dupla de dois tensores de 
segunda ordem e, portanto, é claramente um escalar (invariante). 


Uma rotação y, + y, ao redor do eixo z é executada como duas rotações sucessivas, cada 
uma ao redor do eixo z. Use a representação matricial das rotações para derivar as identidades 
trigonométricas. 

cos(P1 + P2) = COS p4 cos P2 — sen Pysen P2, 


sen(vy + Y2) = sen Yı COS Yo + cos psen po. 
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3.3.17 Um vetor coluna V tem componentes V; e Vo em um sistema inicial (“sem linha”). Calcule Vý e Vz 
para: 


(a) uma rotação das coordenadas através de um ângulo 0 em sentido anti-horário, 
(b) uma rotação do vetor através de um ângulo 0 em sentido horário. 


Os resultados das partes (a) e (b) devem ser idênticos. 


3.3.18 Escreva uma sub-rotina que testará se uma matriz real N x N é simétrica. Simetria pode ser definida 
como 


0 < |aij — ajil < €, 


em que € é alguma pequena tolerância (que leva em conta o erro de truncamento, e assim por diante, 
no computador). 


3.4 Matrizes hermitianas, Matrizes Unitárias 


Definições 

Até aqui admitimos, em geral, que nosso espaço vetorial linear é um espaço real e que os elementos da matriz 

(as representações dos operadores lineares) são reais. Para muitos cálculos da física clássica, elementos matriciais 

reais serão suficientes. Todavia, em mecânica quântica, variáveis complexas são inevitáveis por causa da forma 

das relações básicas de comutação (ou da forma da equação dependente do tempo de Schrödinger). Com isso em 

mente, generalizamos para o caso de elementos matriciais complexos. Para tratar esses elementos, vamos definir, 

ou rotular, algumas novas propriedades. 

1. Conjugado complexo, A*, formado tomando o conjugado complexo (i — —i) de cada elemento, em que 
i=v-1. 


2. Adjunta, At, formada pela transposição de A*, 


AÏ = A* = À. (3.107) 


3. Matriz hermitiana: a matriz A é denominada hermitiana ou auto-adjunta se 
A=A'. (3.108) 


Se A é real, então AÍ = A e matrizes hermitianas são matrizes simétricas reais. Na mecânica quântica (ou 
mecânica matricial), em geral as matrizes são construídas para ser hermitianas ou unitárias. 
4. Matriz unitária: matriz U é denominada unitária se 


ut = Um. (3.109) 


Se U é real, então UT! = Ŭ; portanto, matrizes unitárias reais são matrizes ortogonais. Isso representa uma 
generalização do conceito de matriz ortogonal (compare com a Equação (3.84)). 
5. (AB)* = A*B*, (AB)! = BIAÍ. 

Se os elementos da matriz são complexos, o físico quase sempre se preocupará com matrizes hermitianas 
e matrizes unitárias. Matrizes unitárias têm especial importância na mecânica quântica porque deixam o 
comprimento de um vetor (complexo) inalterado — análoga à operação de uma matriz ortogonal sobre um vetor 
real. É por essa razão que a matriz S da teoria da dispersão é uma matriz unitária. Uma importante exceção em 
matrizes unitárias é o grupo de matrizes de Lorentz, Capítulo 4. Usando o espaço de Minkowski, vemos que essas 
matrizes não são unitárias. 

Em um espaço linear n dimensional complexo, o quadrado do comprimento de um ponto č% = 
a” (x1,%2,...,%n) Ou O quadrado de sua distância desde a origem 0 é definido como zts = Y xix; =>) |x;|2. 
Se uma transformação de coordenada y = Ux: não alterar a distância, então vir = yty = (Ux)'Uz = xtUtUrz. 
Uma vez que «x é arbitrário, resulta que UÍU = 1, isto é, U é uma matriz unitária n x n. Se x' = Arx é um 
mapa linear, então sua matriz nas novas coordenadas torna-se a transformação unitária (análoga à transformação 
de similaridade). 


A' = UAU!, (3.110) 
porque Ux’ = y' = UAx = UAU ty = UAU! y. 
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Matrizes de Pauli e Dirac 
O conjunto de três matrizes 2 x 2, o, de Pauli, 


0 1 0 —i 1 0 


foi introduzido por W. Pauli para descrever uma partícula de spin 1/2 em mecânica quântica não-relativista. Pode- 
se mostrar de imediato que (compare com Exercícios 3.2.13 e 3.2.14) a ø de Pauli satisfaz 


Oi0j + jo; = 20;jlo, anticomutação (3.112) 
CiO j = V0k, i, j, k uma permutação cíclica de 1, 2, 3 (3.113) 
(0;)2 = 15, (3.114) 


em que 15 é a matriz 2 x 2 unitária. Assim, o vetor o /2 satisfaz às mesmas relações de comutação, 
[0;,0;] = Ci0j— oji = 2iEijkTk, (3.115) 


que o momento angular orbital L (L x L = iL, veja o Exercício 2.5.15 e os grupos SO(3) e SU(2) no Capítulo 4). 
As três matrizes o de Pauli e a matriz unidade formam um conjunto completo, portanto, qualquer matriz 
hermitiana 2 x 2, M, pode ser expandida como 


M=mols+mi;ci+tma02+msos=moim-o, (3.116) 


em que os m; formam um vetor constante m. Usando (0;)2 = 1, etraço(o;) = 0 obtemos, pela Equação (3.116), 
os coeficientes de expansão m; formando traços 


2mo = traço(M), 2m; = traço(Mo;), v=1,28. (3.117) 


Somando e multiplicando essas matrizes 2 x 2, geramos a álgebra de Pauli.!” Note que traço(o;) = O para 
i = 1,2,3. 

Em 1927, P. A. M. Dirac estendeu esse formalismo a partículas de movimento rápido de spin 1, tais como 
elétrons (e neutrinos). Para incluir a relatividade especial, ele partiu da energia de Einstein, em vez da cinética 
não-relativista e energia potencial, E? = p2c? + m2ct. A chave da equação de Dirac é fatorar 


E? — pie? -E?-(co.p)=(E-co-p)(E+4co-p)= me, (3.118) 
usando a identidade da matriz 2 x 2 
(o. p)? = plo. (3.119) 


A matriz unidade 2 x 2 1, não está escrita explicitamente na Equação (3.118), e a Equação (3.119) resulta do 
Exercício 3.2.14 para a = b = p. De maneira equivalente, podemos introduzir duas matrizes y’ e y para fatorar 
E? — p?c? diretamente: 


2 
[EY 81>-cy90)-p| 
= E’? 812 +27 8 (0: p} — Edy y +y) 80: p 
= P? -pe = må. (8.119) 
Para que a Equação (3.119”) seja válida, as condições 
yP=1==2, yy+yr=0 (3:120) 


devem ser satisfeitas. Assim, as matrizes y’ e y anticomutam, exatamente como as três matrizes de Pauli; portanto, 
elas não podem ser números reais ou complexos. Como as condições (3.120) podem ser cumpridas por matrizes 
2 x 2, escrevemos sinais de produto direto (veja o Exemplo 3.2.1) na Equação (3.119”) porque são multiplicadas 
por 15, matrizes o respectivamente, sendo 


v=(a Lp Te DE (3.121) 


17 Para conhecer seu significado geométrico, consulte W. E. Baylis, J. Huschilt e Jiansu Wei, Am. J. Phys. 60: 788 (1992). 
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As matrizes 4 x 4 de produto direto na Equação (3.119) são as quatro matrizes y de Dirac convencionais. 


10 0 0 
E E E SD A OUR O 
T aia o Ta A 
00 0 = 
go io À 
1 2 0 oi \ 0 0 1 0 
r=yea=( 9, Je de ve pod Y 
—1 0 00 
0 01 0 
0 o 0 0 0 ~ 
CRE a, 3 
p=180=( 8 e EO E é fera) 
0 10 0 


e, de modo semelhante, para yº = YQ02. Em notação vetorial, o = y Qo é um vetor com três componentes, cada 
um uma matriz 4 x 4, uma generalização do vetor de matrizes de Pauli para um vetor de matrizes 4 x 4. As quatro 
matrizes º são as componentes do quadrivetor y” = (4°, yt, y?, 73). Se reconhecermos na Equação (1.119”) 


Ey Q 12 —-c(y80):p=9"pu=7:p=(Y%,9):(E,cp) (3.123) 


como um produto escalar de dois quadrivetores y“ e p” (veja o grupo de Lorentz no Capítulo 4), então a 
Equação (3.119) com p? = p-p = E? — p2c? pode ser considerada uma generalização quadrivetorial da 
Equação (3.119). 

Resumindo, o tratamento relativista de uma partícula de spin 1/2 leva a matrizes 4 x 4, enquanto o spin 1/2 
de uma partícula não-relativista é descrito pelas matrizes de Pauli, 0,2 X 2. 

Por analogia com a álgebra de Pauli, podemos formar produtos a partir das matrizes y” básicas e de suas 
combinações lineares e a partir da matriz unidade 1 = 14, desse modo generalizando uma álgebra de 16 dimensões 
(denominada álgebra de Clifford!*). Uma base (com propriedades convenientes de transformação de Lorentz, veja 
o Capítulo 4) é dada (em notação matricial 2 x 2 da Equação (3.122) por 


0 1 
Ly = ir = ( fd) ) o Por = il = (3.124) 
As matrizes y anticomutam, isto é, suas combinações simétricas 


FY HF = 2g"”14, (3.125) 


em que g% = 1 g1! g”? g, e g"” = 0 para u Æ v, são zero ou proporcionais à matriz unidade 


4 x 4 14, enquanto as seis combinações anti-simétricas na Equação (3.124) dão novos elementos de base que 
se transformam como um tensor sob transformações de Lorentz (veja o Capítulo 4). Qualquer matriz 4 x 4 
pode ser expandida em termos desses 16 elementos, e os coeficientes de expansão são dados pela formação de 
traços similares ao caso 2 x 2 na Equação (3.117) usando traço(14) = 4,traço(y,) = O,traço(y”) = 0 = 
traço(y57!), traço(o””) = 0 u, v = 0, 1, 2,3 (veja o Exercício 3.4.23). No Capítulo 4 mostramos que ; é ímpar 
sob paridade; portanto, se transforma como um vetor axial que tem paridade par. 

A álgebra do spin gerada pelas matrizes de Pauli é apenas uma representação matricial da álgebra 
quadridimensional de Clifford, enquanto Hestenes e colaboradores (loc. cit.) desenvolveram em seu cálculo 
geométrico uma álgebra livre de representação (isto é, “livre de coordenadas”) que contém números complexos, 
vetores, a subálgebra do quatérnion e produtos externos generalizados como áreas direcionadas (denominadas 
bivetores). Essa estrutura algébrico-geométrica é talhada para a mecânica quântica não-relativista, enquanto 
espinores adquirem aspectos geométricos e os teoremas de Gauss e Stokes aparecem como componentes de 
um teorema unificado. A álgebra geométrica desses autores correspondente à álgebra de dezesseis dimensões 
de Clifford das matrizes y de Dirac é a adequada estrutura livre de coordenadas para mecânica quântica e 
eletrodinâmica. 

A discussão de matrizes ortogonais na Seção 3.3 e matrizes unitárias nesta seção é apenas um início. Extensões 
ulteriores são de importância vital na física de partículas “elementares”. Com as matrizes de Pauli e Dirac podemos 


18D, Hestenes e G. Sobczyk, loc. cit.; D. Hestenes, Am. J. Phys. 39. 1.013 (1971); e J. Math. Phys. 16: 556 (1975). 
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desenvolver funções de onda de espinor para elétrons, prótons e outras partículas relativistas de spin >. As 
rotações de sistemas coordenados levam a D? (a, 8, y), o grupo de rotação usualmente representado por matrizes 
nas quais os elementos são funções dos ângulos de Euler que descrevem a rotação. O grupo unitário especial 
SU(3) (composto de matrizes unitárias 3 x 3 com determinante +1) tem sido usado com considerável sucesso 
para descrever mésons e bárions envolvidos nas interações fortes, uma teoria de calibre que agora é denominada 
cromodinâmica quântica. Essas extensões são consideradas com mais detalhe no Capítulo 4. 


Exercícios 
3.4.1 Mostre que 
det(A*) = (det A)* = det (AŤ). 
3.4.2 Três matrizes de momento angular satisfazem a relação básica de comutação 


3.4.3 
3.4.4 


3.4.5 
3.4.6 


3.4.7 


3.4.8 


3.4.9 


3.4.10 
3.4.11 


3.4.12 


[dvd| =i 


(e permutação cíclica de índices). Se duas das matrizes têm elementos reais, mostre que os 
elementos da terceira devem ser imaginários puros. 


Mostre que (AB)! = BiAÍ. 


Uma matriz C = SÍS. Mostre que o traço é definido positivo a menos que S seja a matriz nula, caso 
em que traço (C) = 0. 


Se A e B são matrizes hermitianas, mostre que (AB + BA) e i(AB — BA) também são hermitianas. 


A matriz C é não-hermitiana. Mostre que, então, C + CÌ e i(C — Ci) são hermitianas. Isso significa 
que uma matriz não-hermitiana pode ser decomposta em duas partes hermitianas, 


C= (C+C)+ (C— ci). 


Es 
=——1 
2i 
Essa decomposição de uma matriz em duas partes de matrizes hermitianas é análoga à 
decomposição de um número complexo z em x + iy, em que x = (z + 2*)/2 e y = (z — 2*)/21. 


A e B são duas matrizes hermitianas não-comutativas 
AB — BA = iC. 


Prove que C é hermitiana. 
Mostre que uma matriz hermitiana permanece hermitiana sob transformações de similaridade 
unitária. 
Duas matrizes A e B são hermitianas. Ache uma condição necessária e suficiente para que seu 
produto AB seja hermitiano. 

Resposta: [A, B] = 0. 
Mostre que a recíproca (isto é, a inversa) de uma matriz unitária é unitária. 


Uma transformação de similaridade particular resulta em 


A! = UAU™H, 
At = UAU. 


Se a relação adjunta for preservada (Ar = At) e det U = 1, mostre que U deve ser unitária. 


Duas matrizes U e H são relacionadas por 


U= et0H 


À 


sendo a real. (A função exponencial é definida por uma expansão de Maclaurin. Isso será feito na 
Seção 5.6.) 

(a) Se H é hermitiana, mostre que U é unitária. 

(b) Se U é unitária, mostre que H é hermitiana. (H é independente de a.) 
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3.4.13 


3.4.14 


3.4.15 
3.4.16 
3.4.17 


3.4.18 


3.4.19 
3.4.20 


3.4.21 


3.4.22 
3.4.23 


Nota: Sendo H a hamiltoniana, 

y(x, t) = U(x, t)y(z,0) = exp(—itH/ħ)y(x, 0) 
é uma solução da equação dependente do tempo de Schrödinger. U(x, t) = exp(—itH/h) é o 
“operador de evolução”. 


Um operador T(t + £,t) descreve a mudança na função de onda de ta t + £. Para € real e 
suficientemente pequeno, de modo que £? possa ser desprezado, 


T(t+et)=1- qeH(o). 


(a) Se T é unitário, mostre que H é hermitiana. 
(b) Se H é hermitiana, mostre que T é unitário. 


Nota: Quando H(t) é independente de tempo, essa relação pode ser colocada em forma exponencial 
— Exercício 3.4.12. 


Mostre que uma forma alternativa, 
1—icH(t)/2h 


TERRO =T TEAOR 


está de acordo com o T da parte (a) do Exercício 3.4.13, desprezando £?, e é exatamente unitário 
(para H hermitiana). 


Prove que o produto direto de duas matrizes unitárias é unitário. 
Mostre que y; anticomuta com todas as quatro 7”. 
Use o símbolo quadridimensional de Levi-Civita cx,»p com £0123 = —l (generalizando as 
Equações (2.93) na Seção 2.9 para quatro dimensões) e mostre que (1) 2y50uv = —iEuvago É 
usando a convenção de soma da Seção 2.6 e Gi) YVAYp Yv = Iv — In Yu F Iur YA F tEzuvp I Y5 
Defina y, = 9uvY” usando g” = g, para elevar e baixar índices. 
Avalie os seguintes traços (veja a Equação (3.123) para a notação): 

(1) traço(y - ay -b) = 4a- b, 

(ii) traço(y -ay-by-c) =0, 
Gii) traço(y -ay-by-cy-d)=4(a-be-d-a-cb-d+a-db-c), 
(iv) traço(ysy ay: by- cy- d) = Sicagura"bP era”. 
Mostre que (1) y, YY = —27%, (1) Yp YP = 49º, e Gii) yr = ye, 
Se M = 1(1 + 75), mostre que 

M? = M. 

Note que y5 pode ser substituída por qualquer outra matriz de Dirac (qualquer I; da 
Equação (3.124)). Se M é hermitiana, então este resultado, M? = M, é a equação de definição 
para um operador de projeção da mecânica quântica. 


Mostre que 
a x a = 2i Q ls, 
onde « = YoY é um vetor 
a =(a1,02,08). 
Note que, se œ é um vetor polar (Seção 2.4), então o é um vetor axial. 
Prove que as 16 matrizes de Dirac formam um conjunto linearmente independente. 


Se admitirmos que uma dada matriz A 4 x 4 (com elementos constantes) pode ser escrita como uma 
combinação linear das 16 matrizes de 16 Dirac 


16 
A= 5 Cili, 
i=1 


mostre que 
ci ~ traço(AT;). 
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3.4.24 SeC = iy2yº é a matriz de conjugação de carga, mostre que Cy!C-1 = —Ẹ", em que ” indica 
transposição. 


3.4.25 Seja x, = A% x, a rotação por um ângulo O ao redor do eixo 3, 


£) = 10, x1 = x1 cos Ô + xasen 0, 


x = —xsen O + xo cos ð, Ta = TS: 


Use R = exp(ido!2/2) = cos0/2 + io!2sen 0/2 (veja a Equação (3.170b)) e mostre que as 
y se transformam exatamente como as coordenadas x”, isto é, Ayy, = RHR. (Note que 
Yu = Juv” e que as y” são bem definidas somente até uma transformação de similaridade.) 
De modo semelhante, se x’ = Ax é um boost (transformação de Lorentz pura) ao longo do eixo 1, 
isto é, 
zo = xo cosh Ç — xysen AG, xi = —xosen AG + zı cosh G, 
g= 19, T3 = &3, 


com tgh = v/ce B = exp(-ito!!/2) = cosh(/2 — iollsen AÇ/2 (veja a Equação (3.170b), 
v "a —1 
mostre que Ayy, = By, B~. 
3.4.26 (a) Dado r’ = Ur, sendo U uma matriz unitária e r um vetor (coluna) com elementos complexos, 
mostre que a norma módulo de r é invariante sob esta operação. 
(b) A matriz U transforma qualquer vetor coluna r com elementos complexos em r”, deixando a 
grandeza invariante: rr = rir”. Mostre que U é unitária. 
3.4.27 | Escreva umasub-rotina para testar se uma matriz complexa n xn é auto-adjunta. Ao exigir igualdade 
de elementos matriciais aij = al; permita uma pequena tolerância € para compensar o erro de 
truncamento do computador. 


3.4.28 Escreva uma sub-rotina que formará a adjunta de uma matriz M x N complexa. 


3.4.29 (a) Escreva uma sub-rotina que tomará uma matriz M x N complexa A e dará como resultado o 
produto ATA. 
Sugestão: Esta sub-rotina pode chamar as sub-rotinas dos Exercícios 3.2.41 e 3.4.28. 
(b) Teste sua sub-rotina tomando A como uma ou mais das matrizes de Dirac, Equação (3.124). 


3.5 Diagonização de Matrizes 


Matriz de Momento de Inércia 

Em muitos problemas de física que envolvem matrizes simétricas reais ou hermitianas complexas, é desejável 
executar uma transformação de similaridade ortogonal real ou uma transformação unitária (correspondente a uma 
rotação do sistema de coordenadas) para reduzir a matriz a uma forma diagonal, com todos os elementos não- 
diagonais iguais a zero. Um exemplo particularmente direto disso é a matriz de momento de inércia | de um corpo 
rígido. Pela definição de momento angular L, temos 


L= ly, (3.126) 


sendo w a velocidade angular.!? Constata-se que a matriz de inércia | tem componentes diagonais 


ss > mu(r? — z?), e assim por diante , (3.127) 
i 

sendo que o índice inferior i refere-se à massa m; localizada em r; = (xi, Yi, zi). Para os componentes não- 

diagonais, temos 


Isy = — X mitiyi = Iya- (3.128) 


Por inspeção, a matriz | é simétrica. Além disso, uma vez que | aparece em uma equação física da forma (3.126), 
que é válida para todas as orientações do sistema de coordenadas, ela pode ser considerada um tensor (regra do 
quociente, Seção 2.3). 

A chave agora é orientar os eixos coordenados (ao longo de uma estrutura de corpo fixo), de modo que os 
Izy e os outros elementos não-diagonais desapareçam. Como conseqüência e indicação dessa orientação, se a 


19 A matriz de momento de inércia também pode ser desenvolvida a partir da energia cinética de um corpo em rotação, T = 1/2(w|l|w). 
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velocidade angular se encontrar ao longo de um desses eixos principais realinhados, a velocidade angular e o 
momento angular serão paralelos. Como ilustração, a estabilidade de rotação é usada por jogadores de futebol 
(americano) quando jogam a bola girando ao redor de seu eixo longo principal. 


Autovetores, Autovalores 


É instrutivo considerar um quadro geométrico deste problema. Se a matriz de inércia | for multiplicada de cada 
lado por um vetor unitário de direção variável, à = (a, 8,7), então, na notação bracket de Dirac da Seção 3.2, 


(âlllâ) = T, (3.129) 


em que 1 é o momento de inércia ao redor da direção ñ e um número (escalar) positivo. Executando a multiplicação, 
obtemos 
I= Issa? + Tb + Ly" + 2Leyaf + 21,07 + 21,209, (3.130) 


uma forma quadrática definida positiva que deve ser um elipsóide (veja a Figura 3.5). Pela geometria analítica, 
sabemos que os eixos coordenados sempre podem ser rotacionados para coincidir com os eixos de nosso elipsóide. 
Em muitos casos elementares, em especial quando a simetria está presente, esses novos eixos, denominados 
eixos principais, podem ser encontrados por inspeção. Podemos achar os eixos localizando os extremos locais 
do elipsóide em termos das componentes variáveis de n, sujeitos à restrição A? = 1. Para lidar com a restrição, 
introduzimos um multiplicador de Lagrange À (Seção 17.6). Diferenciar (h|lh) — A(n/h), 


7 k 


dá como resultado as equações de autovalor 


Iâ) = Alá). (3.132) 


Figura 3.5: Elipsóide de momento de inércia. 


O mesmo resultado pode ser encontrado por métodos puramente geométricos. Agora passamos a desenvolver 
um método geral para achar os elementos diagonais e os eixos principais. 
Se R7} = R é a matriz ortogonal real, tal que n’ = Rn ou |n’) = Rin) na notação de Dirac são as novas 
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coordenadas, então, usando (n'|R = (n| na Equação (3.132), obtemos 
(n|ljn) = (n'|RIR|n”) = Kni? + n? + Tini2, (3.133) 


em que T} > 0 são os momentos de inércia principais. A matriz de inércia |” na Equação (3.133) é diagonal nas 
novas coordenadas, 


. ED 0 
C=RIR=[ 0 g 0 |. (3.134) 
0o 0 B 


Se reescrevermos a Equação (3.134) usando R7! = R na forma 


R/ = IR (3.135) 


e admitirmos que R= (v1, V2, V3) consiste em três vetores colunas, então a Equação (3.135) se subdivide em três 
equações de autovalor 
lv; = Iivi, i= 1,2,3 (3.136) 


com autovalores T; e autovetores v;. Os nomes vieram da literatura alemã sobre mecânica quântica. Como essas 
equações são lineares e homogêneas (para i fixo), pela Seção 3.1 seus determinantes têm de se anular: 


hi- ho hs 
ta laste esal = (3.137) 
hs Los Tag — I; 


Substituindo o autovalor I/ por uma variável À vezes a matriz unidade 1, podemos reescrever a Equação (3.136) 
como 


(1= Av) = 0. (3.136) 


O determinante igualado a zero, 


I=A1/=0, (3.137) 


é um polinômio cúbico em A; sua três raízes, é claro, são os 1/. Voltando à Equação (3.136) ou (3.136) e nela 
substituindo uma raiz por vez, podemos achar os autovetores correspondentes. Por causa de suas aplicações em 
teorias astronômicas, a Equação (3.137) ou (3.137) é conhecida como equação secular.” O mesmo tratamento 
se aplica a qualquer matriz simétrica real |, exceto que seus autovalores não precisam ser todos positivos. Além 
disso, a condição de ortogonalidade na Equação (3.87) para R afirma que, em termos geométricos, os autovetores 
v; São vetores unitários mutuamente ortogonais. Na verdade, eles formam o novo sistema de coordenadas. O fato 
de quaisquer dois autovetores v;, vj serem ortogonais se 1; 1 f resulta da Equação (3.136) em conjunção com a 
simetria de | pela multiplicação por v; e vj, respectivamente. 


(v;lllv:) = Ivi "Vi; = (villlv;) = Ivi Vj. (3.138a) 
Visto que I; # I; e a Equação (3.138a) implicam que (T; — I;)vi - vj = 0, então v; - vj = 0. 


Podemos escrever as formas quadráticas na Equação (3.133) como uma soma de quadrados nas coordenadas 
originais |n), 


(nllln) = (n'|RIRIn) = 5 F(a- vi)’, (3.138b) 


porque, em termos de componentes, as linhas da matriz de rotação em n’ = Rn ou 


m vı- n 
nh |=| vn 
nã vs:n 
20A Equação (3.126) tomará essa forma quando w se encontrar ao longo de um dos eixos principais. Então, L = Aw e lw = Aw. Na 


literatura matemática À costuma ser denominado valor característico, w, um vetor característico. 
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são compostas dos autovetores v;. A identidade subjacente da matriz, 


[= 5 Ilva (vil, (3.1380) 


pode ser vista como a decomposição espectral do tensor de inércia (ou de qualquer matriz simétrica real). Aqui, a 
palavra espectral é apenas um outro termo para a expansão de termos em seus autovalores. Quando multiplicamos 
esta expansão de autovalor por (n| à esquerda e |n) à direita, reproduzimos a relação anterior entre formas 
quadráticas. O operador P; = [|v;)(v;| é um operador de projeção que satisfaz P? = P; que projeta a i-ésima 
componente w; de qualquer vetor |w) = 37, w;|v;) que é expandido em termos do autovetor de base |v.;). Isso é 
verificado por 


Pilw) = 5 wslva (viiva) = wivi) = vi: wv). 
j 


Finalmente, a identidade 


o [və (v:|=1 


expressa a completude da base de autovetor segundo a qual qualquer vetor |w) = 57, w;|v;) pode ser expandido 
em termos dos autovetores. Multiplicar a relação de completude por |w) prova a expansão |w) = 5 ,(vilw)|vi). 

Uma extensão importante do teorema da decomposição espectral se aplica às matrizes comutativas simétricas 
(ou hermitianas) A, B: se [A,B] = 0, então existe uma matriz (unitária) ortogonal que diagonaliza ambas, A e 
B; isto é, ambas as matrizes têm autovetores comuns se os autovalores forem não-degenerados. O inverso desse 
teorema também é válido. 

Para provar esse teorema, diagonalizamos A : Av; = a;v;. Multiplicando cada equação de autovalor por B 
obtemos BAv; = a;Bv; = A(Bv;), que diz que Bv; é um autovetor de A com autovalor a;. Por consegiiência, 
Bv; = biv; com b;. Ao contrário, se os vetores v; são autovetores comuns de A e B, então ABv; = Ab;v; = 
aibivi = BAv;. Uma vez que os autovetores v; são completos, isso implica AB = BA. 


Matrizes Hermitianas 

Para espaços vetoriais complexos, matrizes hermitianas e unitárias desempenham o mesmo papel que matrizes 
simétricas e ortogonais em espaços vetoriais reais, respectivamente. Em primeiro lugar, vamos generalizar o 
importante teorema sobre os elementos diagonais e os eixos principais para a equação de autovalor 


Alr) = Ar). (3.139) 


Agora mostramos que, se A é uma matriz hermitiana?! seus autovalores são reais e seus autovetores são ortogonais. 


Sejam A; e A; dois autovalores, e lr;) e lr;), os autovetores, correspondentes de A, uma matriz hermitiana. 
Então, 


Alri) = Ailri), (3.140) 
Alr;) = Aslr;)- (3.141) 

A Equação (3.140) é multiplicada por (r ;|: 
(r;]Alrs) = Astrglro). (3.142) 


A Equação (3.141) é multiplicada por (r;| para dar 
(rilAlr;) = A(rilr;). (3.143) 
Tomando a adjunta?? dessa equação, temos 


(r;|A'|r;) = Ai(rslri), (3.144) 


2I Se A é real, o requisito hermitiano se reduz a um requisito de simetria, 
2Note que (r;| = |r;)! para vetores complexos. 
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ou 
(r;|Alri) = Ars], ri) (3.145) 


visto que A é hermitiana. Subtraindo a Equação (3.145) da Equação (3.142), obtemos 


Este é um resultado geral para todas as possíveis combinações de à e j. Em primeiro lugar, seja j = i. Então, a 
Equação (3.146) se torna 
(A; — Ai) (rilrs) = 0. (3.147) 


Uma vez que (r;|r;) = 0 seria uma solução trivial da Equação (3.147), concluímos que 


ài = A, (3.148) 
ou À; é real, para todo 1. 
Em segundo lugar, para i # j e À; £ Aj, 
(A; = Aj) (rlr) = 0, (3.149) 
ou 
(r;lr:) = 0, (3.150) 


o que significa que os autovetores de autovalores distintos são ortogonais, sendo a Equação (3.150) nossa 
generalização de ortogonalidade neste espaço complexo.” 

Se A; = A; (caso degenerado), |r;) não é automaticamente ortogonal a |r;), pode ser transformado em 
ortogonal.?* Considere, mais uma vez, o problema físico da matriz de momento de inércia. Se x, é um eixo de 
simetria rotacional, então constataremos que A, = Ag. Cada um dos autovetores |r2) e |r3) é perpendicular ao eixo 
de simetria, |r), mas encontra-se em qualquer lugar no plano perpendicular a |r,); isto é, qualquer combinação 
linear de |r2) e |r3) também é um autovetor. Considere (as|r>2) + as|r3)) com az e az constantes. Então, 


A(aslr>) + aslra)) = a2A2|r2) + asAs]ra) 
= Az (a2|r2) + aslrs)), (3.151) 


como era de esperar, porque x é um eixo de simetria rotacional. Por conseguinte, se |r1) e |r>) são fixos, podemos 
simplesmente escolher que |r3) esteja no plano perpendicular a |r) e também perpendicular a |r>). Um método 
geral de soluções ortogonalizadoras, o processo de Gram-Schmidt (Seção 3.1), é aplicado às funções na Seção 
10.3. 

O conjunto de n autovetores ortogonais |r;) de nossa matriz hermitiana n x n A forma um conjunto completo, 
abrangendo o espaço n dimensional (complexo), 51, |r;)(r;| = 1. Este fato é útil em um cálculo variacional dos 
autovalores, Seção 17.8. 

A decomposição espectral de qualquer matriz hermitiana A é provada por analogia com matrizes simétricas 
reais 


A= Do dilri)(ril, 


com autovalores reais À; e autovetores ortonormais |r;). 

Autovalores e autovetores não são limitados a matrizes hermitianas. Todas as matrizes têm ao menos um 
autovalor e um autovetor. Contudo, somente matrizes hermitianas têm todos os autovetores ortogonais e todos 
os autovalores reais. 


23 A teoria correspondente para operadores diferenciais (teoria de Sturm-Liouville) aparece na Seção 10.2. A equação integral análoga (teoria 
de Hilbert-Schmidt) é dada na Seção 16.4. 

24 Aqui, estamos admitindo que os autovetores das A; n vezes degeneradas abrangem o espaço n dimensional correspondente. Isso pode ser 
mostrado incluindo um parâmetro € na matriz original para remover a degeneração e então deixar que £ se aproxime de zero (compare com o 
Exercício 3.5.30). Isso é análogo a interromper uma degeneração em espectroscopia atômica aplicando um campo magnético externo (efeito 
de Zeeman). 
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Matrizes Anti-Hermitianas 
Ocasionalmente encontramos na teoria quântica matrizes anti-hermitianas: 


At = —A. 


Conforme a análise da primeira parte desta seção, podemos mostrar que 
(a) Os autovalores são imaginários puros (ou zero). 
(b) Os autovetores correspondentes a autovalores distintos são ortogonais. 


4 


A matriz R formada a partir dos autovetores normalizados é unitária. Esta propriedade anti-hermitiana é 
preservada sob transformações unitárias. 


Exemplo 3.5.1 AUTOVALORES E AUTOVETORES DE UMA MATRIZ SIMÉTRICA REAL 


Seja 
01 0 
A=| 10 0). (3.152) 
0 00 
A equação secular é 
-À 1 0 
1 À 0 |=0, (3.153) 
0 —A 
ou 
—A(à?° — 1) =0, (3.154) 
expandindo por menores. As raízes são À = —1,0,1. Para achar o autovetor correspondente a À = —1, 
substituímos esse valor na equação de autovalor, Equação (3.139), 
=A 1 0 x 0 
1 A 0 y |=| 0 |. (3.155) 
0 0 =À z 0 
Com À = — 1, isso resulta 
zr+y=0, z=0. (3.156) 
Dentro de um fator de escala arbitrário e um sinal arbitrário (ou fator de fase), (rı| = (1,—1,0). Note que 


(para |r) real em espaço ordinário) o autovetor destaca uma reta no espaço. O sentido positivo ou negativo não 
é determinado. Essa indeterminação podia ser esperada se notássemos que a Equação (3.139) é homogênea em 
|r}. Por conveniência, exigiremos que os autovetores sejam normalizados para a unidade, (r;|r1) = 1. Com esta 


condição, 
rı V2 7’ 0 3.157 


é fixo, exceto por um sinal geral. Para À = 0 , a Equação (3.139) resulta em 


y=0, 2=0, (3.158) 
(ra] = (0,0, 1) é um autovetor adequado. Por fim, para À = 1, obtemos 
-2+97=0, 2=0, (3.159) 
ou sä 
r3| = | —, —,0 ]. 3.160 


A ortogonalidade de r1, r2 e r3, correspondente a três autovalores distintos, pode ser verificada com facilidade. 
A decomposição espectral correspondente resulta 
1 1 


kei eeii É cat) E PR E 
= 2º Ja a V2 3’ a a) 1 
pe ge 0 o ap U 010 
0 0/0 00 000 
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Exemplo 3.5.2 AUTOVALORES DEGENERADOS 


Considere 
1 0 0 
A=ļ| 0 0 1 (3.161) 
0 1 0 
A equação secular é 
1—à 0 
0 =A 1 /=0 (3.162) 
0 1 eA 
ou 
1-M(X-1)=0, A=-1,1,1, (3.163) 
um caso degenerado. Se A = —1, a equação de autovalor (3.139) resulta 
2x = 0, y+2z=0. (3.164) 


Um autovetor normalizado adequado é 
1 —1 
rı| = | 0, —, — ). 3.165 


pe (3.166) 


Para À = 1, obtemos 


Qualquer autovetor que satisfaça a Equação (3.166) é perpendicular a rı. Temos um número infinito de opções. 
Suponha, como uma das opções possíveis, que rz é tomado como 


1 1 
rə| = | 0, —, — |), 3.167 
o que claramente satisfaz a Equação (3.166). Então, r3 deve ser perpendicular a rı e podemos fazer com que seja 


perpendicular a r por” 
r3 = rı X r2 = (1,0,0). (3.168) 


A decomposição espectral correspondente resulta 


0 
1 
1 1 F i a i 
V E (ya > |+{0,—,— > |+(1,0,0) | 0 
Gamal CoE l A 
vê v2 
0 0 0 00 0 100 10 
=-| 0 5 -il+/0551l+[000)]=/[001 
E o 11 000 01 


Funções de Matrizes 

Polinômios com um ou mais argumentos matriciais são bem definidos e ocorrem com fregiiência. A série de 
potência de uma matriz também pode ser definida, contanto que ela convirja para cada elemento da matriz (veja o 
Capítulo 5). Por exemplo, se A é qualquer matriz n x n, então as séries de potência 


exp(A) = 5, 1w, (3.169a) 
j=0 7 

sen(A) = X` A, (3.169b) 
j=0 

cos(A) = $` a A? (3.169c) 
j=0 


25 A utilização do produto cruzado é limitada a espaço tridimensional (veja a Seção 1.4). 
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são matrizes n x n bem definidas. Para as matrizes de Pauli o, a identidade de Euler para O real e k = 1,2 ou 3 


exp(i0:0) = 12 cos 0 + ioysen 6, (3.170a) 


resulta da reunião de todas as potências ímpares e pares de 0 em séries separadas usando o? = 1. Para as matrizes 
4 x 4 gÏ! = 1 de Dirac com (0)*)2 = 1 se j £ k = 1,2 ou 3 obtemos, de maneira similar (sem escrever mais a 
óbvia matriz unidade 14), 


exp(io/t0) = cos 6 + ioitsen 0, (3.170b) 


enquanto 


exp(iot() = cosh Ç + io!!sen hC (3.170c) 


vale para Ç real porque (i0º")2 = 1 para k = 1,2, 
Para uma matriz hermitiana A há uma matriz unitária U que a diagonaliza; isto é, UAU! = [01,092,...,0n]. 
Então, a fórmula de traço 


det(exp(A)) = exp(traço(A)) (3.171) 


é obtida (veja os Exercícios 3.5.2 e 3.5.9) por 
det (exp(A)) = det (U exp(A)U?) = det (exp(UAU!)) 


= detexp[m,a2,...,ân] = dete", e°?, E e°” ] 
= JI e“i = exp © ai) = exp(traço(A)), 


usando UA'Ut = (UAU!) na série de potências da Equação (3.169a), para exp(UAUĴ), e o teorema do produto 
para determinantes na Seção 3.2. 

Essa fórmula de traço é um caso especial da lei da decomposição espectral para qualquer função f(A) 
(infinitamente diferenciável) para a hermitiana A: 


HA) = > fODlrr, 


em que |r;) são os autovetores comuns de A e A?. Essa expansão de autovalor resulta de Ailr;) = X'r;), 
multiplicada por f()(0)/j! e somada sobre j para formar a expansão de Taylor de f(X;) e dar como 
resultado f(A)|r;) = f(A;)lr;). Por fim, somando sobre i e usando completude, obtemos f(A) X; |r;)lr;l = 


> fr (r;] = f(A), q.e.d. 


Exemplo 3.5.3 EXPONENCIAL DE UMA MATRIZ DIAGONAL 
Se a matriz A é diagonal como 
RE 1 0 
3— 0 -1 , 


então sua enésima potência também é diagonal com seus elementos matriciais diagonais elevados à enésima 


potência: 
“(1 0 
03 = 0 -1 . 


Então, fazendo o somatório da série exponencial, elemento por elemento, temos 


oO 
Se SME n! 0 = e 0 
mi o (IT po Lj 
0 Sm n! 0 e 
Se escrevermos a matriz diagonal geral como A = [a1,a2,..., an] com elementos diagonais a;, então A” = 
lat, a3,..., a] e, fazendo o somatório das exponenciais, mais uma vez elemento por elemento, obtemos 


e^ = [EC e%2,... e°]. 


Usando a lei da decomposição espectral, obtemos diretamente 


es = et! (1,0) (o) +eton(,) = ( à e ). 
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Uma outra relação importante é a fórmula de Baker-Hausdorff, 


exp(iG)H exp(-iG) = H + [iG, H] + iG, liG, H]] +, (8.172) 


que resulta da multiplicação da série de potencias por exp(iG) e da reunião dos termos com as mesmas potências 
de iG. Aqui, definimos 
IG, H] = GH — HG 


como o comutador de G e H. 

A análise precedente tem a vantagem de exibir e esclarecer relações conceituais na diagonalização de matrizes. 
Contudo, para matrizes maiores do que 3 x 3, ou talvez 4 x 4, o processo rapidamente se torna tão incômodo 
que recorremos a computadores e a técnicas iterativas.” Uma dessas técnicas é o método de Jacobi 
para determinar autovalores e autovetores de matrizes simétricas reais. Essa técnica de Jacobi para determinar 
autovalores e autovetores e o método de Gauss-Seidel para resolver sistemas de equações lineares simultâneas 
são exemplos de métodos de afrouxamento. São técnicas iterativas nas quais os erros podem decrescer ou afrouxar 
enquanto as iterações continuam. Métodos de afrouxamento são utilizados extensivamente para a solução de 
equações diferenciais parciais. 


Exercícios 
3.5.1 (a) Começando com o momento angular orbital do i-ésimo elemento de massa, 


L; =r; X Pi = Miri X (w x ri), 


derive a matriz de inércia tal que L = lw, |L) = I|w). 
(b) Repita a derivação começando com energia cinética 


Ti qmiloxr)? (T= Solto). 


3.5.2 Mostre que os autovalores de uma matriz ficam inalterados se a matriz é transformada por uma 
transformação de similaridade. 
Esta propriedade não está limitada a matrizes simétricas ou a matrizes hermitianas. Ela vale 
para qualquer matriz que satisfaça a equação de autovalor, Equação (3.139). Se conseguirmos 
trazer nossa matriz para a forma diagonal por uma transformação de similaridade, então duas 
consegiiências imediatas são: 
1. O traço (soma de autovalores) é invariante sob uma transformação de similaridade. 
2. O determinante (produto de autovalores) é invariante sob uma transformação de similaridade. 
Nota: A invariância do traço e do determinante costuma ser demonstrada usando o teorema de 
Cayley-Hamilton: uma matriz satisfaz sua própria equação (secular) característica. 

3.5.3 Como um inverso do teorema que afirma que matrizes hermitianas têm autovalores reais e que 
autovetores correspondentes a autovalores distintos são ortogonais, mostre que, se 
(a) os autovalores de uma matriz são reais e 

: lrn ee 

(b) os autovetores satisfazem rir; = d;; = (tilr;), 
então a matriz é hermitiana. 

3.5.4 Mostre que uma matriz real não-simétrica não pode ser diagonalizada por uma transformação de 
similaridade ortogonal. 
Sugestão: Admita que a matriz real não-simétrica pode ser diagonalizada e desenvolva uma 
contradição. 

3.5.5 As matrizes que representam as componentes do momento angular Jz, Jy e J, são todas 
hermitianas. Mostre que os autovalores de J2, em que J? = J2 +J? + JŽ}, são reais e não-negativos. 


3.5.6 A tem autovalores A; autovetores correspondentes |x;). Mostre que A”! tem os mesmos 
=] 
autovetores, mas com autovalores À; . 


26Em sistemas de dimensões mais altas, a equação secular pode ser muito mal condicionada no que diz respeito à determinação de suas 
raízes (os autovalores). A solução direta por computador pode ser muito inexata. Em geral, preferem-se técnicas iterativas para diagonalizar a 
matriz original. Veja as Seções 2.7 e 2.9 de Press et al., loc. cit. 
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3.5.7 


3.5.8 


3.5.9 


3.5.10 


3.5.11 


3.5.12 


Uma matriz quadrada com determinante zero é denominada singular. 


(a) Se A é singular, mostre que há ao menos um vetor coluna não-zero v, tal que 
Alv) = 0. 


(b) Se há um vetor não-zero |v}, tal que 
Alv) = 0, 


mostre que A é uma matriz singular. Isso significa que, se uma matriz (ou operador) tiver 
zero como um autovalor, a matriz (ou operador) não tem nenhuma inversa e seu 
determinante é zero. 


A mesma transformação de similaridade diagonaliza cada uma de duas matrizes. Mostre que as 
matrizes originais devem comutar. (Isto é particularmente importante na formulação matricial — de 
Heisenberg — da mecânica quântica.) 


Duas matrizes hermitianas A e B têm os mesmos autovalores. Mostre que A e B são relacionadas 
por uma transformação de similaridade unitária. 


Ache os autovalores e um conjunto ortonormal (ortogonal e normalizado) de autovetores para as 
matrizes do Exercício 3.2.15. 


Mostre que a matriz de inércia para uma única partícula de massa m em (x,y,z) tem um 
determinante. Explique esse resultado em termos da invariância do determinante de uma matriz sob 
transformação de similaridade (Exercício 3.3.10) e de uma possível rotação do sistema coordenado. 


Um certo corpo rígido pode ser representado por três massas pontuais: mı = 1 em (1,1,-2), 
ma = 2 em (—1,-1,0)ems = 1 em (1,1,2). 
(a) Ache a matriz de inércia. 


(b) Diagonalize a matriz de inércia obtendo os autovalores e os eixos principais (como autovetores 
ortonormais). 


1,0,1) t 
| 

| 

| 

| 


Figura 3.6: Localização de massa para tensor de inércia. 
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3.5.13 


3.5.14 


3.5.15 


3.5.16 


3.5.17 


3.5.18 


3.5.19 


3.5.20 


3.5.21 


3.5.22 


Massas unitárias são colocadas como mostra a Figura 3.6. 


(a) Ache a matriz do momento de inércia. 
(b) Ache os autovalores e um conjunto de autovetores ortonormais. 
(c) Explique a degeneração em termos da simetria do sistema. 


4 —1 — A =2 
Resposta: l= | —1 4 —1 rı =(1//3,1//3,1//3) 
E E A=. 


Uma massa mı = 1/2 kg está localizada em (1,1,1) (metros), uma massa ms = 1/2 kg está em 
(—1,—1,—1). As duas massas são unidas por um bastão ideal (sem peso, rígido). 


(a) Ache o tensor de inércia desse par de massas. 

(b) Ache os autovalores e autovetores dessa matriz de inércia. 

(c) Explique o significado, a significância física do autovalor A = 0. Qual é a significância do 
autovetor correspondente? 

(d) Agora que você resolveu este problema por técnicas matriciais bastante sofisticadas, explique 
como poderia obter 
(1) A = 0 e à =? — por inspeção (isto é, usando bom senso). 
(2) rA=0 =? — por inspeção (isto é, usando física de calouro). 


Massas unitárias estão nos oito vértices de um cubo (+1,+1,+1). Ache a matriz 
do momento de inércia e mostre que há uma degeneração tripla. Isso significa que, 
no que concerne a momentos de inércia, a estrutura cúbica exibe simetria esférica. 

Ache os autovalores e autovetores ortonormais correspondentes das matrizes seguintes (como 
verificação numérica, note que a soma dos autovalores é igual à soma dos elementos diagonais 
da matriz original, Exercício 3.3.9). Note também a correspondência entre det A = 0 e a existência 
de À = 0, como requerido pelos Exercícios 3.5.2 e 3.5.7. 


1 0 1 
A=ļ| 0 1 0). Resposta: À = 0, 1,2. 
1 0 1 
1 v2 0 
A=| <2 0 0 Resposta: A = —1, 0,2. 
0 0 0 
1 1 0 
A= 101 Resposta: A = —1,1,2. 
0 1 1 
1 v8 0 
A=| 48 1 y8 Resposta: A = —3, 1,5. 
0 v8 1 
1 0 0 
A=ļ| 0 1 1). Resposta: A = 0, 1,2. 
0 1 1 
1 0 0 
A=| 0 1 v21. Resposta: A = —1, 1,2. 
0 v2 0 
0 1 0 
A= 1 0 1). Resposta: À = — V2, 0, v2. 
0 10 
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2 0 0 
3.5.23 A=|0 1 1 Resposta: À = 0, 2, 2. 
011 
0 1 1 
3.5.24 A= 101 Resposta: A = —1,-1,2. 
110 
1 -1 -1 
3.5.25 A=ļ| -1 1 11. Resposta: A = —1, 2, 2. 
—1 —1 1 
1 1 1 
3.5.26 A= 1 1 1]. Resposta: À = 0, 0,3. 
1 1 1 
5 0 2 
3.5.27 A= 1 0 J. Resposta: A = 1,1,6. 
202 
110 
3.5.28 A=ļ| 1 10). Resposta: À = 0, 0, 2. 
00 0 
5 0 y3 
3.5.29 A= 0 3 0 Resposta: À = 2,3,6. 
v3 0 3 
3.5.30 (a) Determine os autovalores e autovetores de 
le 
e lJ“ 
Note que os autovalores são degenerados para € = 0, mas que os autovetores são ortogonais 
para todo e £ 0 ee > 0. 
(b) Determine os autovalores e autovetores de 
1 1 
Es B 
Note que os autovalores são degenerados para £ = 0 e que para essa matriz (não-simétrica) os 
autovetores ( = 0) não abrangem o espaço. 
(c) Ache o co-seno do ângulo entre os dois autovetores como uma função de £ para 0 < € < 1. 
3.5.31 (a) Tome os coeficientes das equações lineares simultâneas do Exercício 3.1.7 como os elementos 
matriciais a;j da matriz A (simétrica). Calcule os autovalores e autovetores. 
(b) Forme uma matriz R cujas colunas são os autovetores de A, e calcule o produto matricial triplo 
RAR. 
Resposta: À = 3, 33163. 
3.5.32 Repita o Exercício 3.5.31 usando a matriz do Exercício 3.2.39. 
3.5.33 Descreva as propriedades geométricas da superfície 


xr? +2ry + 2y? +2yz +2 =1. 


Como ela está orientada em espaço tridimensional? Ela é uma seção cônica? Caso positivo, de que 
tipo? 
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3.5.34 Para uma matriz hermitiana n x n A com autovalores distintos A; e uma função f, mostre que a lei 
da decomposição espectral pode ser expressa como 


n es 
A= ON 


Esta fórmula se deve a Sylvester. 


3.6 Matrizes Normais 


Na Seção 3.5 nossa preocupação primordial foram as matrizes hermitianas ou matrizes simétricas reais e o processo 
propriamente dito de achar os autovalores e autovetores. Nesta seção?” generalizamos para matrizes normais, 
considerando as matrizes hermitianas e a matriz unitária como casos especiais. Também são considerados o 
importante problema da física referente a modos normais de vibração e o problema numericamente importante 
de matrizes mal condicionadas. 

Uma matriz normal é uma matriz que comuta com sua adjunta, 


[A,A!] = 0. 
Tabela 3.1 
Matriz Autovalores Autovetores 
(para diferentes autovalores) 
Hermitiana Real Ortogonais 
Anti-hermitiana  Imaginária pura (ou zero) Ortogonais 
Unitária Grandeza unitária Ortogonais 
Normal Se A tem autovalor À, Ortogonais 
AŤ A* A e AÏ têm os 


mesmos autovetores 


Exemplos óbvios e importantes são matrizes hermitianas e matrizes unitárias. Mostraremos que matrizes 
normais têm autovetores ortogonais (veja a Tabela 3.1). Nossa demonstração terá duas etapas. 
I. Admitamos que A tem um autovetor |x} e autovalor correspondente À. Então, 


Alx) = Alx) (3.173) 
ou 
(A — AD|x) = 0. (3.174) 
Por conveniência, a combinação A — Al será denominada B. Tomando a adjunta da equação (3.174), obtemos 
(x|(A — AD)! = 0 = (x|Bİ. (3.175) 
Como 
[(A — à1)}t, (A — à1)] = [A, At] = 0, 
temos 
[B, Bt] = 0. (3.176) 
A matriz B também é normal. 
Pelas Equações (3.174) e (3.175) formamos 
(x|BİB|x) = 0. (8.177) 
Essa expressão é igual a 
(x|BB! |x) = 0 (3.178) 


21 Matrizes normais são a maior classe de matrizes que podem ser diagonalizadas por transformações unitárias. Uma discussão mais ampla 
de matrizes normais pode ser encontrada em P. A. Macklin, “Normal matrices for physicists”. Am. J. Phys. 52: 513 (1984). 
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pela Equação (3.176). Agora, a Equação (3.178) pode ser reescrita como 
(Bt|x))'(B'px)) = 0. (3.179) 


Assim, 
B'|x) = (A! — à*1)|x) = 0. (3.180) 


Vemos que, para matrizes normais, A! tem os mesmos autovetores que A, exceto os autovalores conjugados 
complexos. 
II. Agora, considerando mais de um autovetor-autovalor, temos 


Alxi) = Ailxi), (3.181) 
Abx;) = Aj|x;). (3.182) 


Multiplicando a Equação (3.182) a partir da esquerda por (x;|, temos 
(x; |Abe;) = A; (xilx;). (3.183) 
Tomando a transposta da Equação (3.181), obtemos 
(xilA = (At). (3.184) 


Pela Equação (3.180), sendo que At tem os mesmos autovetores que A, exceto os autovalores conjugados 
complexos, 


(Atpe)! = At) = Axil. (3.185) 
Substituindo na Equação (3.183), temos 
Ai xil) = A;(x;|x5) 
ou 
(A; — àj) (x|x;) = 0. (3.186) 


Essa expressão é a mesma que a Equação (3.149). 
Para A; Æ Aj, 
(xybxi) = 0. 


Os autovetores correspondentes a diferentes autovalores de uma matriz normal são ortogonais. Isso significa 
que uma matriz normal pode ser diagonalizada por uma transformação unitária. A matriz unitária requerida pode 
ser construída a partir dos autovetores ortonormais, como mostramos antes, na Seção 3.5. 

O inverso desse resultado também é verdadeiro. Se A pode ser diagonalizada por uma transformação unitária, 
então A é normal. 


Modos Normais de Vibração 

Consideramos as vibrações de um modelo clássico de molécula de CO». É uma ilustração da aplicação de 
técnicas matriciais a um problema que não começa como um problema matricial. Também nos dá um exemplo 
dos autovalores e autovetores de uma matriz real assimétrica. 


Exemplo 3.6.1. Mopos Normais 


Considere três massas sobre o eixo x ligadas por molas, como mostra a Figura 3.7. Admitimos que as forças das 
molas são lineares (pequenos deslocamentos, lei de Hooke) e que a massa é obrigada a permanecer sobre o eixo x. 


Usando uma coordenada diferente para cada massa, a segunda lei de Newton resulta no conjunto de equações 


7 k 

tı = -ye = T2) 

R k k 

ə = —— (x2 — £1) — — (£2 — T3) (3.187) 
m m 
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Figura 3.7: Oscilador duplo. 


O sistema de massas está vibrando. Procuramos as fregiiências comuns, w, tais que todas as massas vibrem com 
a mesma fregiiência. Esses são os modos normais. Seja 


Ti = Tie, i= 1,2,3. 


Substituindo este conjunto na Equação (3.187), podemos reescrevê-lo como 


tok 0 
M M zı Tı 
k 2k k = 2 
O e mo £2 = +w zo |, (3.188) 
0 -E £E T3 T3 
M M 


com o fator comum e*** dividido. Temos uma equação matricial de autovalor com a matriz assimétrica. A equação 
secular é 


MU M 
— 2k — w2 -E = 0. (3.189) 
k k 
0 -m Mew 
Isso leva a 7 o É 
2/8 2 Que AN a 
w (x w Do = 57) 0 
Os autovalores são 
o k k 2k 
us M' M m’ 


todos reais. 
Os autovetores correspondentes são determinados voltando à Equação (3.188) e nela substituindo os 
autovalores, um por vez. Para w? = 0, a Equação (3.188) dá como resultado, 


zı — £2 = 0, —z1 + 2x2 — 13 = 0, —T2 + £3 = Q. 


Então obtemos 
£i = T2 = T3. 


Essa expressão descreve uma translação pura sem nenhum movimento relativo das massas e nenhuma vibração. 
Para w? = k/M, a Equação (3.188) resulta em 


zı = — T3, Lo = 0. 


As duas massas externas estão se movimentando em direções opostas. A massa que está no centro é estacionária. 
Para w? = k/M + 2k /m, as componentes do autovetor são 


2M 
Tı = Lg, ty = ——— Tı. 
m 
As duas massas externas estão se movimentando juntas. A massa situada no centro está se movimentando em 
direção contrária às outras duas externas. O momento líquido é zero. 
Qualquer deslocamento das três massas ao longo do eixo x pode ser descrito como uma combinação linear 
desses três tipos de movimento: translação, mais duas formas de vibração. E 
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Sistemas Mal Condicionados 
Um sistema de equações lineares simultâneas pode ser escrito como 


Ab) =|y) ou Aly)=x, (3.190) 


com A e |y) conhecidos e |x) desconhecido. Quando um pequeno erro em |y) resulta em um erro maior em |x), 
então a matriz A é dita mal condicionada. Sendo |x} um erro em |x} e [ôx) um erro em |y}, os erros relativos 
podem ser escritos como 


e = rea [tia E (3.191) 


(xx) (yly) 


Aqui, K (A), uma propriedade da matriz A, é denominada número da condição. Para A hermitiana, uma forma do 
número da condição é dada por? 


IAmá 
K(A) = E (3.192) 
mín 
Uma forma aproximada devida a Turing? é 
K(A) = n[Ai;lmáx [457 | máx’ (3.193) 


na qual n é a ordem da matriz e [A;;] é o elemento máximo em A. 


máx 
Exemplo 3.6.2 UMA MATRIZ MAL CONDICIONADA 

Um exemplo comum de uma matriz mal condicionada é a matriz de Hilbert, H;; = (i + j — 1) !. A matriz de 
Hilbert de ordem 4, H4, é encontrada em um ajuste de dados por mínimos quadrados a um polinômio de terceiro 
grau. Temos 


15354 
1 1 1/1 
sd a (3.194) 
3 4 5 6 
1 1 1 1 
4 5 6 7 
Os elementos da matriz inversa (ordem n) são dados por 
— 1) i— 1)! j— 1)! 
(151) = CDE (oia d=r o 
I i+j-1 [= Mg - 1)? (n = i)n- j)! 
Para n = 4, 
16 —120 240 —140 
Hoa —120 1200 —2700 1680 (3.196) 


240  —2700 6480 —4200 
—140 1680 —4200 2800 


Pela Equação (3.193) a estimativa de Turing para o número de condição para 


Kiring = 4 x 1 x 6480 
= 2,59 x 10º. 
Esse resultado alerta que um erro de entrada pode ser multiplicado por 26.000 no cálculo do resultado de saída, 
o que equivale a dizer que H4 está mal condicionada. Se você encontrar um sistema muito mal condicionado, terá 
duas alternativas (além de abandonar o problema): 
(a) Tentar uma abordagem matemática diferente. 
(b) Tentar obter números mais significativos e levar a tarefa a cabo por força bruta. 


Como vimos antes, técnicas matriciais de autovetor-autovalor não estão limitadas à solução de problemas 
estritamente matriciais. Um outro exemplo da transferência de técnicas de uma área para outra é visto na aplicação 
de técnicas matriciais — a solução de equações integrais de autovalor de Fredholm, Seção 16.3. Por sua vez, essas 
técnicas matriciais são reforçadas pelo um cálculo variacional da Seção 17.8. E 


28G. E. Forsythe e C. B. Moler, Computer Solution of Linear Algebraic Systems. Englewood Cliffs, NJ, Prentice Hall (1967). 
29Compare com J. Todd, The Condition of the Finite Segments of the Hilbert Matrix, Applied Mathematics Series n2 313. Washington, DC: 
National Bureau of Standards. 
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Exercícios 


3.6.1 


3.6.2 


3.6.3 
3.6.4 


3.6.5 


3.6.6 


3.6.7 


3.6.8 


3.6.9 


3.6.10 


3.6.11 


3.6.12 


Mostre que toda matriz 2 x 2 tem dois autovetores e correspondentes autovalores. Os autovetores não 
são necessariamente ortogonais e podem ser degenerados. Os autovalores não são necessariamente 
reais. 


Como uma ilustração do Exercício 3.6.1, ache os autovalores e correspondentes autovetores para 


12) 


Note que os autovetores não são ortogonais. 
Resposta: À = 0, rı = (2, —1); 
Ao = 4, r2 = (2,1). 
Se A é uma matriz 2 x 2, mostre que seus autovalores À satisfazem a equação secular. 


Admitindo que uma matriz unitária U satisfaz uma equação de autovalor Ur = Ar, mostre que os 
autovalores da matriz unitária têm módulo unitário. Este mesmo resultado é válido para matrizes 
ortogonais reais. 


Visto que uma matriz ortogonal que descreve uma rotação em um espaço tridimensional real é 
um caso especial de uma matriz unitária, tal matriz ortogonal pode ser diagonalizada por uma 
transformação unitária. 


(a) Mostre que a soma dos três autovalores é 1 + 2 cos y, em que y é o ângulo líquido de rotação 
ao redor de um único eixo fixo. 
(b) Dado que um autovalor é 1, mostre que os outros dois autovalores devem ser et? e e 'P. 
Nossa matriz de rotação ortogonal (elementos reais) tem autovalores complexos. 


A é uma matriz hermitiana de enésima ordem com autovetores ortonormais |x;) e autovalores reais 
À <A < A3 < -+ < An. Mostre que para um vetor de módulo unitário |y}, 


A < (ylIAly) < An. 


Uma matriz particular é hermitiana e também unitária. Mostre que seus autovalores são todos +1. 
Nota: As matrizes de Pauli e Dirac são exemplos específicos. 


Para sua teoria relativista do elétron, Dirac requeria um conjunto de quatro matrizes an- 
ticomutativas. Admita que essas matrizes devem ser hermitianas e unitárias. Se essas matrizes 
são n x n, mostre que n deve ser par. Com matrizes 2 x 2, matrizes inadequadas (por quê?), 
isso demonstra que as menores matrizes possíveis que formam um conjunto de quatro matrizes 
anticomutativas, hermitianas, unitárias, são 4 x 4. 


A é uma matriz normal com autovalores À, e autovetores ortonormais |x,,). Mostre que A pode ser 
escrita como 
A = > An|Xn)(Xnl. 
n 


Sugestão: Mostre que ambas as formas desse autovetor, essa A e a A original dão o mesmo resultado 
quando agem sobre um vetor arbitrário |y). 


A tem autovalores —1 e autovetores correspondentes ( 1) e (°). Construa A. 


0 
1 0 
Resposta: A = ( 0 1 | 


Uma matriz não-hermitiana A tem autovalores A; e autovetores correspondentes |u;). A matriz 
adjunta A! tem o mesmo conjunto de autovalores mas autovetores correspondentes diferentes, |v;). 
Mostre que os autovetores formam um conjunto biortogonal, no sentido de que 


Dado um par de equações: 


Alfa) = AnlBn) 
Algn) = Anlfn) com A real, 


180 
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3.6.14 


3.6.15 


3.6.16 


3.6.17 


(a) Prove que |f,) é um autovetor de (ÃA) com autovalor AZ. 
(b) Prove que |gn) é um autovetor de (AÁ) com autovalor AZ. 
(c) Explique como você sabe que 

(1) Os |f») formam um conjunto ortogonal. 

(2) Os |gn) formam um conjunto ortogonal. 

(3) AŽ é real. 


Prove que A do exercício anterior pode ser escrito como 
A = 5 AnlBn) (nl, 
n 


com os |gn) e (fn | normalizados para unidade. 
Sugestão: Expanda seu vetor arbitrário como uma combinação linear de [£,). 


Dado i 
2 2 
a=ali A): 


(a) Construa a transposta À e as formas simétricas AA e AÅ. 

(b) Por AÑ|gn) = A2|gn), ache An e |gn). Normalize os |gn)}. 

(c) Por ÁAIf,) = AZ |gn), ache À, [mesmo da (b)] e |f,). Normalize os |f,,). 
(d) Verifique que Alfa) E AnlBn) e Álgn) = Anlfn). 

(e) Verifique que A = 57, Anlgn)(£n|. 


Dados os autovalores A, = 1, A2 = —1 e os autovetores correspondentes 


m=(3) w=) to-(2) e e=) 


(a) construa A; 
(b) verifique que Alf, ) = Anlgn); 
(c) verifique que Algn) = Anlfn). 


1 1 —1 
Resposta: A = —= E 
p A\1l 1 
Este exercício é uma continuação do Exercício 3.4.12, em que a matriz unitária U e a matriz 
hermitiana H são relacionadas por 


U= et0H 


(a) Se traço H = 0, mostre que det U = +1. 
(b) Se det U = +1, mostre que traço H = 0. 


Sugestão: H pode ser diagonalizada por uma transformação de similaridade. Então, interpretando a 
exponencial por uma expansão de Maclaurin, U também é diagonal. Os autovalores correspondentes 
são dados por u; = exp(iah;). 

Nota: Essas propriedades e as do Exercício 3.4.12 são vitais no desenvolvimento do conceito de 
geradores na teoria de grupo, Seção 4.2. 


Uma matriz A tem n autovalores 4;. Se B = e^, mostre que B tem os mesmos autovetores que A, 


com os autovalores correspondentes B; dados por B; = exp(A;). 
Nota: e^ é definido pela expansão de Maclaurin da exponencial: 


2 3 


A 
An 
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3.6.18 | Uma matriz P é um operador de projeção (veja a discussão após a Equação (3.138c)) que satisfaz a 
condição 
P? =P. 


Mostre que os autovalores correspondentes (p2)» e py satisfazem a relação 
TOR = (o)? = Px 


Isso significa que os autovalores de P são O e 1. 


3.6.19 Na equação matricial autovetor-autovalor 
Alr;) = Ailri), 


A é uma matriz hermitiana n x n. Por simplicidade, admita que seus n autovalores reais são distintos 
e que À; é o maior. Se |r} é uma aproximação de |r1), 


le) = |r1) + $ ôli), 
1=2 


mostre que 
(r/Afr) 
(rir) 
e que o erro em À; é de ordem |ô;|?. Considere |6;| < 1. 


Sugestão: Os n |r;) formam um conjunto ortogonal completo que abrange o espaço n dimensional 
(complexo). 


< ài 


3.6.20 Duas massas iguais estão ligadas uma à outra e as paredes por molas, como mostra a Figura 3.8. As 
massas são obrigadas a permanecer sobre uma linha horizontal. 


(a) Estabeleça a equação de aceleração newtoniana para cada massa. 
(b) Resolva a equação secular para os autovetores. 
(c) Determine os autovetores e, assim, os modos normais de movimento. 


Figura 3.8: Oscilador triplo. 


3.6.21 Dada uma matriz normal A com autovalores À;, mostre que AÍ tem autovalores A;, sua parte real 
(A + AŤ) /2 tem autovalores R(A;), e sua parte imaginária (A — A?) /2i tem autovalores S(A;). 
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Teoria dos Grupos 


O juízo disciplinado sobre o que é agradável, simétrico e 
elegante tem-se revelado repetidas vezes um excelente 
guia sobre o modo como a natureza funciona. 


MURRAY GELL-MANN 


4.1 Introdução à Teoria dos Grupos 


Na mecânica clássica, a simetria de um sistema físico leva às leis da conservação. A conservação do momento 
angular é uma consegiiência direta da simetria rotacional, que significa invariância sob rotações espaciais. No 
primeiro terço do século XX, Wigner e outros perceberam que a invariância era um conceito fundamental para o 
entendimento dos novos fenômenos quânticos e para o desenvolvimento de teorias adequadas. Assim, na mecânica 
quântica o conceito de momento angular e spin tornou-se ainda mais essencial. Suas generalizações, isospin na 
física nuclear e simetria de sabor na física de partículas, são ferramentas indispensáveis para construir e resolver 
teorias. Generalizações do conceito de invariância de calibre da eletrodinâmica clássica para a simetria de isospin 
resultaram na teoria de calibre eletrofraca. 

Em cada caso, o conjunto dessas operações de simetria forma um grupo. A teoria dos grupos é a ferramenta 
matemática para tratar invariantes e simetrias. Ela traz unificação e formalização de princípios, tais como reflexões 
espaciais, ou paridade, momento angular e geometria, que são muito usadas por físicos. 

O papel fundamental da teoria dos grupos em geometria foi reconhecido há mais de um século por matemáticos 
(por ex., o Programa Erlanger de Felix Klein). Em geometria euclidiana, a distância entre dois pontos, o produto 
escalar de dois vetores ou métrica não são alterados sob rotações ou translações. Essas simetrias são características 
dessa geometria. Em relatividade especial, a métrica, ou produto escalar de quatro vetores, difere da métrica da 
geometria euclidiana no sentido de que não é mais definida positiva e é invariante sob transformações de Lorentz. 

Para um cristal, a simetria dos grupos contém apenas um número finito de rotações em valores discretos de 
ângulos ou reflexões. A teoria desses grupos discretos ou finitos, desenvolvida originalmente como um ramo 
da matemática pura, agora é uma ferramenta útil para o desenvolvimento da cristalografia e da física da matéria 
condensada. Uma breve introdução a essa área aparece na Seção 4.7. Quando as rotações dependem de ângulos 
que variam continuamente (os ângulos de Euler da Seção 3.3), os grupos de rotação têm um número infinito de 
elementos. Esses grupos contínuos (ou grupos de Lie!) são o tópico das Seções 4.2-4.6. Na Seção 4.8 damos 
uma introdução a formas diferenciais, com aplicações às equações de Maxwell e tópicos dos Capítulos 1 e 2, que 
permite ver esses tópicos sob uma perspectiva diferente. 


Definição de um Grupo 

Um grupo G pode ser definido como um conjunto de objetos ou operações, rotações, transformações, denominados 

elementos de G, que podem ser combinados ou “multiplicados” para formar um produto bem definido em G, 

denotado por um *, que satisfaz as seguintes quatro condições: 

1. Se a e b são dois elementos quaisquer de G, então o produto a x b também é um elemento de G, em que b age 
antes de a; ou (a, b) para a x b associa (ou mapeia) um elemento a x b de G com o par (a, b) de elementos de G. 
Essa propriedade é conhecida como “G é fechado sob multiplicação de seus próprios elementos”. 

2. Essa multiplicação é associativa: (a + b) x c = a * (b * c). 

3. Há um elemento unitário? em G, tal que 1 xa = ax 1 = a para todo elemento em G. O unitário é único: 


1O nome se deve ao matemático norueguês Sophus Lie. 
2Segundo E. Wigner, o elemento unitário de um grupo costuma ser rotulado Æ, do alemão Einheit, isto é, unidade, ou apenas 1, ou 1 para 
identidade. 
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=x 1=T: 

4. Há um inverso, ou recíproco, de cada elemento a de G, rotulado at, tal que a * at = a™t xa = 1. O inverso 
é único: sea! e a”! são ambos inversos de a, então a! = aT! x (a x a7!) = (a7! x a) x a™t = amt. 


Visto que usar * para representar multiplicação é maçante, em geral esse sinal é omitido e fica simplesmente 

subentendido. De agora em diante, escreveremos ab em vez de a * b. 

e Se um subconjunto G” de G é fechado sob multiplicação, ele é um grupo e é denominado subgrupo de G; isto 
é, G” é fechado sob a multiplicação de G. O unitário de G sempre forma um subgrupo de G. 

e Se g9'g !* é um elemento de G” para qualquer g de G e g' de G”, então G” é denominado subgrupo invariante 
de G. O subgrupo constituído do unitário é invariante. Se os elementos do grupo forem matrizes quadradas, 
então 99'g” t! corresponde a uma transformação de similaridade (veja a Equação (3.100)). 

e Se ab = ba para todos a, b de G, o grupo é denominado abeliano, isto é, a ordem não importa nos produtos; a 
multiplicação comutativa costuma ser denotada por um sinal +. Exemplos são espaços vetoriais cujo unitário é 
o vetor zero e —a é o inverso de a para todos os elementos a de G. 


Exemplo 4.1.1 GRUPOS ORTOGONAIS E UNITÁRIOS 


Matrizes ortogonais n x n formam o grupo O(n), e SO(n) se seus determinantes são +1 (S quer dizer “especial”). 
Se O; = Do para į = 1 e 2 (veja a Seção 3.3 para matrizes ortogonais) são elementos de O(n), então o produto 


0,05 = 0,0, = 0;!07! = (0,05)! 


também é uma matriz ortogonal em O(n), provando assim o fechamento sob multiplicação (de matrizes). O inverso 
é a matriz transposta (ortogonal). O unitário do grupo é a matriz unitária n dimensional 1,,. Uma matriz ortogonal 
real n x n tem n(n — 1)/2 parâmetros independentes. Para n = 2, há somente um parâmetro: um ângulo. Para 
n = 3, há três parâmetros independentes: os três ângulos de Euler da Seção 3.3. 

Se O; = Ort (para i = 1 e 2) são elementos de SO(n), então o fechamento ainda exige provar que seu produto 
tem determinante +1, o que resulta do teorema do produto no Capítulo 3. 

Do mesmo modo, matrizes unitárias n x n formam o grupo U(n), e SU(n) se seus determinantes são +1. Se 
ui = Ls? (veja a Seção 3.4 para matrizes unitárias) são elementos de U(n), então 


(U1U2)* = ULUÍ = U5!U7! = (U1U2)7}, 


portanto, o produto é unitário e um elemento de U(n), provando assim fechamento sob multiplicação. Cada matriz 
unitária tem uma inversa (sua adjunta hermitiana) que, novamente, é unitária. 

Se ut =U; 1 são elementos de SU(n), então o fechamento requer que provemos que seu produto também tem 
determinante +1, o que resulta do teorema do produto no Capítulo 3. E 
e Grupos ortogonais são denominados grupos de Lie; isto é, eles dependem de parâmetros que variam 

continuamente (os ângulos de Euler e sua generalização para dimensões mais altas); eles são compactos porque 

os ângulos variam em intervalos fechados finitos (que contêm o limite de qualquer seqüência convergente de 
ângulos). Grupos unitários também são compactos. Translações formam um grupo não-compacto porque o limite 
de translações com distância d — oo não faz parte do grupo. O grupo de Lorentz também não é compacto. 


Homomorfismo, Isomorfismo 

Pode haver uma correspondência entre os elementos de dois grupos: um para um, dois para um ou muitos para 

um. Se essa correspondência preservar a multiplicação do grupo, dizemos que os dois grupos são homomórficos. 

Uma correspondência homomórfica muito importante entre o grupo de rotação SO(3) e o grupo unitário SU(2) é 

desenvolvida na Seção 4.2. Se a correspondência for um-para-um, ainda preservando a multiplicação de grupos, 

então os grupos são isomórficos. 

e Se um grupo G é homomórfico a um grupo de matrizes G”, então G'é denominado representação de G. Se G e 
G” são isomórficos, a representação é denominada fiel. Há muitas representações de grupos; elas não são únicas. 


Exemplo 4.1.2  Rorações 


Um outro exemplo instrutivo para um grupo é o conjunto de rotações de coordenadas em sentido anti-horário do 
espaço euclidiano tridimensional ao redor de seu eixo z. Pelo Capítulo 3 sabemos que tal rotação é descrita por uma 


3 Suponha que os elementos de um grupo sejam rotulados g;, os elementos de um segundo grupo, h;. Então g; +> h; é uma correspondência 
um-para-um para todos os valores de 1. Se g;9; = gk € hih; = hg, então gy e hy devem ser os elementos correspondentes do grupo. 
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transformação linear das coordenadas envolvendo uma matriz 3 x 3 composta de três rotações que dependem dos 
ângulos de Euler. Se o eixo z é fixo, a transformação linear é através de um ângulo « do sistema de coordenadas 
xy para uma nova orientação na Equação (1.8), Figura 1.6, e Seção 3.3: 


q! x cosy seny 0 x 
y |=R(g)| y |=| -senp cosy 0 y (4.1) 
z z 0 0 1 Z 


envolve só um ângulo da rotação ao redor do eixo z. Como mostramos no Capítulo 3, a transformação linear de duas 
rotações sucessivas envolve o produto das matrizes correspondentes à soma dos ângulos. O produto corresponde a 
duas rotações, R; (y1 )Rz (Y2), e é definido pela rotação em primeiro lugar pelo ângulo y, e então por y4. Conforme 
a Equação (3.29), isso corresponde ao produto das submatrizes ortogonais 2 x 2 


cosy; sen; cosyo Sen Yə 


—sen Y; cosy; —sen Yə cosys 
(4.2) 
cos(p; + 2) sen(py + 5) 


—sen(p, + >) cos(py +45) 


usando as fórmulas de adição para as funções trigonométricas. A unidade no canto inferior direito da matriz 
na Equação (4.1) também é reproduzida na multiplicação. O produto é claramente uma rotação, representada 
pela matriz ortogonal com ângulo y, + Y2. A multiplicação associativa de grupos corresponde à multiplicação 
associativa de matrizes. E comutativa, ou abeliana, porque a ordem em que essas rotações são executadas não 
importa. A inversa da rotação com ângulo ọ é a rotação com o ângulo —q. A unidade corresponde ao ângulo y = 0. 
Eliminando os vetores de coordenadas na Equação (4.1), podemos associar a matriz da transformação linear com 
cada rotação, que é uma multiplicação de grupos que preserva o mapeamento um para um, um isomorfismo: as 
matrizes formam uma representação fiel do grupo de rotação. A unidade no canto direito também é supérflua, 
assim como os vetores de coordenadas, e pode ser suprimida. Isso define um outro isomorfismo e representação 
pelas submatrizes 2 x 2: 
cosy siny O 
cosy seng 
R-(p)= | -seny cosy 0 | >R(g)= 5 (4.3) 
—seny cosy 
0 0 1 


O nome do grupo é SO(2), se o ângulo « variar continuamente de O para 27; SO(2) tem infinitamente muitos 
elementos e é compacto. 
O grupo de rotações R, é obviamente isomórfico ao grupo de rotações na Equação (4.3). A unidade com y = 0 
e a rotação com y = 7 formam um subgrupo finito. Os subgrupos finitos com ângulos 27m /n, sendo n um inteiro, 
m=0,1,...,n — 1 são cíclicos; isto é, as rotações R(27m/n) = R(27/n)”. E 
Em seguida discutiremos somente os grupos de rotação SO(n) e grupos unitários SU(n) entre os clássicos 
grupos de Lie. (Mais exemplos de grupos finitos serão dados na Seção 4.7.) 


Representações — Redutível e Irredutível 
A representação de elementos de um grupo por matrizes é uma técnica muito poderosa e tem sido adotada quase 
universalmente pelos físicos. A utilização de matrizes não impõe nenhuma restrição significativa. Pode-se mostrar 
que os elementos de qualquer grupo finito e dos grupos contínuos das Seções 4.2-4.4 podem ser representados por 
matrizes. Exemplos são as rotações descritas na Equação (4.3). 

Para ilustrar como representações matriciais surgem de uma simetria, considere a equação estacionária de 
Schrödinger — ou alguma outra equação de autovalor, tal como lv; = I;v;, para os principais momentos de inércia 
de um corpo rígido na mecânica clássica, como por exemplo, 


Hy = Ey. (4.4) 


Vamos admitir que a hamiltoniana H permaneça invariante sob um grupo G de transformações R em G (rotações 
de coordenadas, por exemplo, para um potencial central V(r) na hamiltoniana H); isto é, 


Hr = RHR! = H, RH = HR. (4.5) 
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Agora considere uma solução y da Equação (4.4) e a “rotacione”: y — Ry. Então, RY tem a mesma energia E 
porque, multiplicando a Equação (4.4), por R e usando a Equação (4.5), temos como resultado 


RH% = E(Ry) = (RHR D Ry = H(Ry). (4.6) 


Em outras palavras, todas as soluções rotacionadas Ry são degeneradas em energia ou formam o que os físicos 
denominam multipleto. Por exemplo, os estados de spin-up (para cima) e spin-down (para baixo) de um elétron 
ligado no estado fundamental do hidrogênio formam um dubleto, e os estados cujos números quânticos de projeção 


são m = —l, —l + 1,...,l do momento angular orbital | formam um multipleto com 2! + 1 estados de base. 
Vamos admitir que esse espaço vetorial Vy de soluções transformadas tenha uma dimensão finita n. Sejam 
Yi a,- -, Yn uma base. Visto que Ry; é um membro do multipleto, podemos expandi-lo em termos de suas 
bases 
R$; => rir (4.7) 
k 


Assim, a cada R em G podemos associar uma matriz (rj). Exatamente como no Exemplo 4.1.2, duas rotações 
sucessivas correspondem ao produto de suas matrizes, portanto esse mapa R — (r;x) é uma representação de 
G. Para que uma representação seja irredutível, é necessário que possamos tomar qualquer elemento de Vy, e, 
fazendo uma rotação de todos os elementos R de G, transformá-lo em todos os outros elementos de Vy. Se nem 
todos os elementos de Vy forem alcançados, então Vy se subdivide em uma soma direta de dois ou mais subespaços 
vetoriais, Vy = Vi $ V2 & --- , que são mapeados sobre si mesmos, rotacionando seus elementos. Por exemplo, 
o estado 2s e os estados 2p do número quântico principal n = 2 do átomo de hidrogênio têm a mesma energia 
(isto é, são degenerados) e formam uma representação redutível porque o estado 2s não pode ser rotacionado para 
estados 2p e vice-versa (o momento angular é conservado sob rotações). Nesse caso a representação é denominada 
redutível. Então, podemos achar uma base em Vy (isto é, existe uma matriz unitária U) de modo que 


rı 0 
Ulra)ut= | 0 r o (4.8) 
para todo R de G, e todas as matrizes (rjg) têm forma de blocos diagonais similar. Aqui, r1, r2, ... são matrizes 


de dimensões mais baixas do que (rj) alinhadas ao longo da diagonal e os 0ºs são matrizes compostas de zeros. 
Podemos dizer que a representação foi decomposta em rı + r2 + --- junto com Vy =V DV O---. 

As representações irredutíveis desempenham um papel na teoria dos grupos que é aproximadamente análogo 
ao dos vetores unitários da análise vetorial. Elas são as representações mais simples; todas as outras podem ser 
montadas a partir delas. (Veja a Seção 4.4 sobre coeficientes de Clebsch-Gordan e tableaux de Young.) 


Exercícios 
4.11 Mostre que uma matriz ortogonal n x n tem n(n — 1)/2 parâmetros independentes. 
Sugestão: A condição de ortogonalidade, Equação (3.71), provê limitações. 
4.1.2 Mostre que uma matriz unitária n x n tem n? — 1 parâmetros independentes. 
Sugestão: Cada elemento pode ser complexo, dobrando o número de parâmetros possíveis. Algumas 
das equações de restrição também são complexas e contam como duas restrições. 


4.1.3 O grupo linear especial SL(2) consiste em todas as matrizes 2 x 2 (com elementos complexos) que 
têm um determinante +1. Mostre que essas matrizes formam um grupo. 
Nota: O grupo SL(2) pode ser relacionado com o grupo completo de Lorentz na Seção 4.4 por uma 
relação muito semelhante à existente entre o grupo SU(2) e o grupo SO(3). 

4.1.4 Mostre que as rotações ao redor do eixo z formam um subgrupo de SO(3). Este subgrupo é 
invariante? 

4.1.5 Mostre que, se R, S,T são elementos de um grupo G, de modo que RS = Te R > (rik), S > 
(Sik) é uma representação de acordo com a Equação (4.7), então 


(ra (8a) = (ta = rinsar), 


2 


isto é, a multiplicação de grupos traduz-se em multiplicação de matrizes para qualquer 
representação de grupo. 
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4.2 Geradores de Grupos Contínuos 


Uma propriedade característica de grupos contínuos, conhecidos como grupos de Lie, é que os parâmetros de 
um elemento de produto são funções analíticas? dos parâmetros dos fatores. A natureza analítica das funções 
(diferenciabilidade) nos permite desenvolver o conceito de gerador e reduzir o estudo do grupo inteiro a um estudo 
dos elementos do grupo na vizinhança do elemento de identidade. 

A idéia essencial de Lie era estudar elementos R em um grupo G que fossem infinitesimalmente próximos à 
unidade de G. Vamos considerar o grupo SO(2) um exemplo simples. As matrizes de rotação 2x 2 na Equação (4.2) 
podem ser escritas em forma exponencial usando a identidade de Euler, Equação (3.170a), como 


cosy seng l , 
R(g) = = lo cos Y + issen y = exp(iczp). (4.9) 
—sen y cosy 


Pela forma exponencial é óbvio que a multiplicação dessas matrizes é equivalente à adição dos argumentos 


R(p2)R(%1) = exp(ioa>) explic2p1) = exp(ioz(%1 + p2)) = R(Y1 + p2). 


Rotações próximas a 1 têm ângulo pequeno ọ = 0. 
Isso sugere que procuremos uma representação exponencial 


R = exp(icS) = 1 + ieS + O(e°), €—>0, (4.10) 


para elementos do grupo R em G próximos da unidade 1. As transformações infinitesimais são £S, e os S são 
denominados geradores de G. Eles formam um espaço linear porque a multiplicação dos elementos do grupo R se 
traduz na adição de geradores S. A dimensão desse espaço vetorial (sobre os números complexos) é a ordem de 
G, isto é, o número de geradores linearmente independentes do grupo. 

Se R é uma rotação, ela não altera o elemento de volume do espaço coordenado que ela rotaciona, isto é, 
det(R) = 1, e podemos usar a Equação (3.171) para ver que 


det(R) = exp(traço (In R)) = exp(istraço (S)) = 1 


indica que etraço (S) = 0 e, dividindo pelo parâmetro pequeno, porém não-zero, €, que geradores têm traços 
nulos. 
traço (S) = 0. (4.11) 


Esse é o caso não somente dos grupos de rotação SO(n) mas também dos grupos unitários SU(n). 
Se R de G na Equação (4.10) é unitário, então St = S é hermitiano, o que também é o caso de SO(n) e SU(n). 
Isso explica por que o à extra foi inserido na Equação (4.10). 
A seguir, vamos desmembrar a unidade em quatro etapas, de maneira semelhante ao transporte paralelo na 
geometria diferencial. Expandimos os elementos do grupo 
R; = exp(ic;S;) =1 + 1€;S; = se252 +... ; 


R7} = exp(—ie;S:) = 1 — ie:Si — 46?S? +, 


(4.12) 


até a segunda ordem no parâmetro de grupo pequeno £; porque os termos lineares e diversos termos quadráticos 
são cancelados no produto (Figura 4.1) 


R7 'R7'R;R; = 1+ Eie; |S; S] +... , 
=1+88) dSp+, (4.13) 


quando a Equação (4.12) é substituída na Equação (4.13). A última linha é válida porque o produto na 
Equação (4.13) é, novamente, um elemento de grupo, R;;, próximo à unidade no grupo G. Por conseguinte, 
seu expoente deve ser uma combinação linear dos geradores S, e seu parâmetro infinitesimal de grupo tem de 
ser proporcional ao produto c;c;. Comparando ambas as linhas na Equação (4.13), encontramos a relação de 
fechamento dos geradores do grupo de Lie, G, 


(Si, Si] = XO Sr- (4.14) 
k 


4 Aqui, analítica significa ter derivadas de todas as ordens. 
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Figura 4.1: Ilustração da Equação (4.13). 


Os coeficientes ci; são as constantes estruturais do grupo G. Uma vez que o comutador na Equação (4.14) é 
anti-simétrico em i e j, o mesmo acontece com as constantes estruturais nos índices inferiores, 


e ss, (4.15) 


Se o comutador na Equação (4.14) for tomado como uma lei de multiplicação de geradores, vemos que o espaço 
vetorial de geradores se torna uma álgebra, a álgebra de Lie G do grupo G. Uma álgebra tem duas estruturas de 
grupo, um produto comutativo denotado por um símbolo + (essa é a adição de geradores infinitesimais de um 
grupo de Lie) e uma multiplicação (o comutador de geradores). Muitas vezes, uma álgebra é um espaço vetorial 
com uma multiplicação, tal como um anel de matrizes quadradas. Para SU(! + 1), a álgebra de Lie é denominada 
As, para SO(21 + 1) é B;, e para SO(21) é D,, em que | = 1,2,... é um inteiro positivo, denominado mais adiante 
grau do grupo de Lie G ou de sua álgebra G. 

Por fim, a identidade de Jacobi vale para todos os comutadores duplos 


[[S:, S3], Sx] + [[S;, Sx], Si] + [ISk Si], S3] =0, (4.16) 


o que é verificado com facilidade usando a definição de qualquer comutador [A, B] = AB — BA. Quando a 
Equação (4.14) é substituída na Equação (4.16) encontramos uma outra restrição às constantes estruturais, 


3 Leg (Sm, Sk] + CH [Sm Si] + CISm, S1} = 0. (4.17) 
Inserindo novamente a Equação (4.14), a Equação (4.17) implica 


> fan + Ck CmiSn + kicmjSn} = 0, (4.18) 


mn 


em que o fator comum Sp (e o somatório sobre n) pode ser descartado porque os geradores são linearmente 
independentes. Daí, 
D A at kehe + ckicms) = 0. (4.19) 
As relações (4.14), (4.15) e (4.19) formam a base das álgebras de Lie pelas quais elementos finitos do grupo de Lie 
próximos à sua unidade podem ser reconstruídos. 
Voltando à Equação (4.5), a inversa de Ré R7! = exp(—i£S). Expandimos H de acordo com a fórmula de 
Baker-Hausdorff, Equação (3.172), 
H = Hr = exp(ieS)H exp(-icS) = H + ie[S, H] — 42° [S[S, H]] + --- (4.20) 
Descartamos H da Equação (4.20), dividimos pelo £, pequeno (porém não-zero), e deixamos que £ — 0. Então a 
Equação (4.20) indica que o comutador 


İS, H] = 0. (4.21) 


Se S e H são matrizes hermitianas, a Equação (4.21) implica que S e H podem ser diagonalizadas simultaneamente 
e têm autovetores comuns (para matrizes, veja a Seção 3.5; para operadores, veja o lema de Schur na Seção 4.3). 
Se S e H são operadores diferenciais como a hamiltoniana e o momento angular orbital na mecânica quântica, 
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então a Equação (4.21) indica que S e H têm autofunções comuns e que os autovalores degenerados de H podem 
ser distinguidos pelos autovalores dos geradores S. Essas autofunções e autovalores, s, são soluções de equações 
diferenciais separadas, SY, = s, portanto a teoria dos grupos (isto é, as simetrias) leva à separação de variáveis 
para uma equação diferencial parcial que é invariante sob as transformações do grupo. 

Por exemplo, vamos tomar a hamiltoniana de uma única partícula, 
R o h2 


Ly 
2m r2 ðr ðr a 2mr?2 bs 


H = 


que é invariante sob SO(3) e, portanto, uma função da distância radial r, do gradiente radial e do operador 
rotacionalmente invariante L? de SO(3). Substituindo o operador de momento angular orbital L? por seu autovalor 
Il + 1), obtemos a equação radial de Schrödinger (ODE — equação diferencial ordinária), 


R ldd RII+4I) 


2m r2 dr” dr 2mr?2 


H Ri(r) = + V(r) Rı(r) = EiRi(r), 
em que Ry(r) é a função de onda radial. 

Para simetria cilíndrica, a invariância de H sob rotações ao redor do eixo z exigiria que H fosse independente 
do ângulo de rotação «p, o que leva à ODE 


HRm(z, p) = EmBm(z, p), 


sendo m o autovalor de L, = —10/0y, o componente z do operador do momento angular orbital. Se quiser 
examinar mais exemplos, veja o método de separação de variáveis para equações diferenciais parciais na Seção 9.3 
e funções especiais no Capítulo 12. Esta é, de longe, a mais importante aplicação da teoria de grupo na mecânica 
quântica. 

Nas subseções seguintes estudaremos exemplos de grupos ortogonais e unitários para entender melhor os 
conceitos gerais desta seção. 


Grupos de Rotação SO(2) e SO(3) 
Para SO(2) como definido pela Equação (4.3) há somente um gerador linearmente independente, o», e a ordem de 
SO(2) é 1. Obtemos os pela Equação (4.9) por diferenciação na unidade de SO(2), isto é, y = 0, 


fd (4.22) 
=—4 = 05. . 
pe -1 0 i 


Para as rotações R; (p) ao redor do eixo z descritas pela Equação (4.1), o gerador é dado por 


. “[ -seny coso 
—idR(p)/dp|p=0 = ~i ( ) 


— cosy —sen 


0 —i 0 
—idR-(p)/delp-0=S-= | i 0 0 |, (4.23) 
0 0 


em que o fator į é inserido para fazer de S, um hermitiano. Então, a rotação R,(ðọp) através de um ângulo 
infinitesimal y pode ser expandida até a primeira ordem em ô pequeno como 


R-(ôp) = 13 + 1075... (4.24) 
Uma rotação finita R(p) pode ser composta de rotações infinitesimais sucessivas 
R.(094 + 095) = (1 + iðy1S2)(1 + 10998.) (4.25) 


Seja dy = y/N para N rotações com N — oco. Então, 


0) [1 + (ip/N)S-]™ = exp(igS.). (4.26) 


= lim 

N>oo0 
Esta forma identifica S, como o gerador do grupo R., um subgrupo abeliano de SO(3), o grupo de rotações em 
três dimensões com determinante +1. Cada matriz 3 x 3 R- (p) é ortogonal e, portanto, unitária, e traço(S.) = 0, 
de acordo com a Equação (4.11). 
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Por diferenciação das rotações de coordenadas 


l 9 ` cos O —sen 0 
Re(%) = EA y ida = Be) 0o ı 0o |, 42) 
0 Lei si sen O cos 
obtemos os geradores 
00 0 0 Oi 
Se= | 0 0 il, Sy = 0 00 (4.28) 
0 à 0 — 


de R;(R,), o subgrupo de rotações ao redor dos eixos. 


Rotação de Funções e Momento Angular Orbital 

Na discussão precedente, os elementos de grupo são matrizes que rotacionam as coordenadas. Qualquer sistema 
físico que esteja sendo descrito é mantido fixo. Agora vamos manter as coordenadas fixas e rotacionar uma função 
p(x, y, z) relativa às nossas coordenadas fixas. Com R para rotacionar as coordenadas, 


x = Rx, (4.29) 
definimos R sobre p por 
Ry(zx, y, z) = Y (z, y, z) = y(x’). (4.30) 
Traduzindo em palavras, R opera sobre a função 1, criando uma nova função 1)” que é numericamente igual a 
p(x"), em que x’ são as coordenadas rotacionadas por R. Se R rotaciona as coordenadas em sentido anti-horário, o 
efeito de R é rotacionar o padrão da função y em sentido horário. 
Voltando às Equações (4.30) e (4.1), considere novamente uma rotação infinitesimal, p — dy. Então, usando 
R, Equação (4.1), obtemos 
R-(ðp)p(z, y, z) = lx + yôp,y — xp, z). (4.31) 
O lado direito pode ser expandido em primeira ordem no ó pequeno para resultar 


R-(5p)Ylz, y, 2) = (x, y,2) — dp(xoy/0y — voy /0x) + Odp)? 


sendo que a expressão diferencial entre chaves é o momento angular orbital angular iL, (Exercício 1.8.7). Visto 
que uma rotação ao redor do eixo z primeiro de y e em seguida de dp é dada por 


Rolo + dp) = Rz (ðp)R- (p) = (1 — iðpL-)R-(p)Y, (4.33) 
temos (como uma equação de operador) 


dR; ani R-(y + dp) — R-(9) 
dy 390 Folio 


= —iL.Ri(g). (4.34) 


Nesta forma, a Equação (4.34) é integrada de imediato para 
R.(p) = exp(-ipL.). (4.35) 


Note que R.. (>) rotaciona funções (em sentido horário) relativas a coordenadas fixas e que L, é a componente z 
do momento angular orbital L. A constante de integração é fixada pela condição de fronteira R.(0) = 1. 
Como sugerido pela Equação (4.32), L, relaciona-se a S, por 


0/0 
. o o 
L, = (x,y,2)Sz | 9/0y | =i r=— -yz ), (4.36) 
Oy ox 
0/0z 
portanto, Ly, Ly e L, satisfazem as mesmas relações de comutação, 
[Li, Lj] = i£ijkLk, (4.37) 


que Sz, Sy e S; e dão como resultado as mesmas constantes estruturais ic;;k de SO(3). 
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Homomorfismo SU(2) — SO(3) 


Uma vez que matrizes unitárias 2 x 2 transformam vetores bidimensionais complexos preservando a norma desses 
vetores, elas representam as transformações mais gerais (uma base em espaço de Hilbert) de funções de onda de 
spin 5 em mecânica quântica não-relativista. Por convenção, os estados de base desse sistema são escolhidos como 


correspondendo a estados de spin 5 dirigidos para cima (up) e para baixo (down), respectivamente. Podemos 
mostrar que o grupo unitário especial SU(2) de matrizes unitárias 2 x 2 com determinante +1 tem como 
geradores todas as três matrizes o; de Pauli (enquanto as rotações da Equação (4.3) formam um subgrupo abeliano 
unidimensional). Portanto, SU(2) é de ordem 3 e depende de três parâmetros contínuos reais £, n, Ç, que costumam 
ser denominados parâmetros de Cayley-Klein. Para construir seu elemento geral, começamos com a observação 
de que aquelas matrizes 2 x 2 ortogonais são matrizes unitárias reais, portanto formam um subgrupo de SU(2). 
Também vemos que 


é unitária para um ângulo real a com determinante 4-1. Portanto, essas matrizes simples e evidentemente unitárias 
formam um outro subgrupo de SU(2) do qual podemos obter todos os elementos de SU(2), isto é, a matriz 2 x 2 
unitária geral de determinante +1. Para uma função de onda de spin 5 de dois componentes da mecânica quântica, 
essa matriz unitária diagonal corresponde à multiplicação da função de onda com spin para cima por um vetor de 
fase et% e da componente com spin para baixo pelo fator de fase inverso. Usando o ângulo real n em vez de ọ para 
a matriz de rotação e então multiplicando pelas matrizes unitárias diagonais, construímos uma matriz unitária 2 x 2 
que depende de três parâmetros e é, claramente, um elemento mais geral de SU(2): 


elas 0 cosy senn ef o0 
( O ema —senm cosn 0 et? ) 
e'“ cosm e'“sen n eP 0 
E -e““senm eLcosm 0 es 
eto+8) cosm ela- sen n 
E -eto-Psenn  eita+P) cosm 


Definindo a + 8 = £, a — 8 = Ç, na verdade construímos o elemento geral def SU(2): 


VtEn0 e'S cos n e'Ssen n a b Es 
dad een n ecos ) bar jJ? ` 


Para ver isso, escrevemos o elemento geral SU(2) como U = (e 2) com números complexos a, b, c, d, de modo 


que det(U) = 1. Escrevendo unitariedade, Ut = UT t, e usando a Equação (3.50) para a inversa, obtemos 


at ct d —b 
č dœ jJ Ae a ? 
indicando que c = —b*, d = a*, como mostra a Equação (4.38). É fácil verificar que o determinante det(U) = 1 e 


que UŤU = 1 = UU! são válidos. 
Para obter os geradores, diferenciamos (e desprezamos fatores gerais irrelevantes): 


1 0 
—10U/08 e-0,m=0 = 0 1 ) = 03, (4.39a) 


0 ci 
—19U/0mjp=0.c=0 = ( ) = 02. (4.39b) 
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Para evitar um fator 1/sen ņ para n — O na diferenciação com relação a 6, desta vez usamos o lado direito 


i 


da Equação (4.38) para U para imaginários puros b = iß com 8 — 0, de modo que a = y1- 8° de 
la|? + |b|? = a? + 8° = 1. Diferenciando tal U, obtemos o terceiro gerador, 
2 E 
o [vid al = sal JF {091} 
'5 5 =—4 ý B = =01. (4.39) 
BNB 1=8 ag i EA a 1 0 

As matrizes de Pauli são todas de traço nulo e hermitianas. 
Tendo as matrizes de Pauli como geradores, os elementos U1, Us, Us de SU(2) podem ser gerados por 


Uı = exp(iaj01/2), U2 = exp(iaç02/2), Us = exp(iago3/2). (4.40) 


Os três parâmetros a; são reais. O fator extra 1/2 está presente nos expoentes para fazer com que S; = c;/2 
satisfaça as mesmas relações de comutação, 


[S;, S;] = lEijkSk, (4.41) 


que o momento angular na Equação (4.37). 

Para relacionar e comparar nossos resultados, a Equação (4.3) dá um operador de rotação para rotacionar as 
coordenadas cartesianas no espaço tridimensional Rê, Usando a matriz do momento angular S3, temos como 
o operador de rotação correspondente em um espaço bidimensional (complexo) Rz(p) = explipo3/2). Para 
rotacionar a função vetorial de onda de duas componentes (spinor) ou uma partícula de spin 1/2 em relação 
a coordenadas fixas, o operador de rotação correspondente é R.(/) = exp(—iy03/2), de acordo com a 
Equação (4.35). 

De modo mais geral, usando a identidade de Euler, Equação (3.1770a), na Equação (4.40) obtemos 


U; = cos( SÉ) +io; sia( 4). (4.42) 


Aqui, o parâmetro a; aparece como um ângulo, o coeficiente de um momento angular « parecido com uma 
matriz na Equação (4.26). A seleção de matrizes de Pauli corresponde às rotações do ângulo de Euler descritas 
na Seção 3.3. 

Como acabamos de ver, os elementos de SU(2) descrevem rotações em um espaço bidimensional complexo 
que deixam |21|2 + |z2|? invariante. O determinante é +1. Há três parâmetros reais independentes. Nosso grupo 
ortogonal real SO(3) claramente descreve rotações em um espaço tridimensional ordinário com a importante 
característica de deixar x? + y? + z? invariante. E também há três parâmetros reais independentes. As 
interpretações da rotação e a igualdade de números de parâmetros sugerem a existência de alguma correspondência 
entre os grupos SU(2) e SO(3). Desenvolvemos aqui esta correspondência. 

A operação de SU(2) sobre uma matriz é dada por uma transformação unitária, Equação (4.5), com R = U e 
Figura 4.2: 


Figura 4.2: Ilustração de M’ = UMU''na Equação (4.43). 


M’ = UMU!. (4.43) 


“livro” — 2007/8/1 — 15:06 — page 193 — #203 


4. TEORIA DOS GRUPOS 193 


ELSEVIER 


Tomando M como uma matriz 2 x 2, notamos que qualquer matriz 2 x 2 pode ser escrita como uma combinação 
linear da matriz unidade com as três matrizes de Pauli da Seção 3.4. Seja M a matriz de traço zero, 


z T—s 
M=zxoj+yoo+zos= ; É ; (4.44) 
x+y = 


sendo que a matriz unidade não entra. Uma vez que o traço é invariante sob uma transformação de similaridade 
unitária (Exercício 3.3.9), M’ deve ter a mesma forma, 
1 1 1 1 z q — iy 
M = £ 01 +Y 02 +Z 03 = nr dA , : (4.45) 
£ +y =Z 
O determinante também é invariante sob uma transformação unitária (Exercício 3.3.10). Por conseguinte, 


(0 +y? + 2°) =—(1" +y? +22), (4.46) 


ou £? + y? + 22 é invariante sob essa operação de SU(2), exatamente como acontece com SO(3). Operações de 
SU(2) sobre M devem produzir rotações das coordenadas x, y, z que ali aparecem. Isso sugere que SU(2) e SO(3) 
podem ser isomórficos ou, ao menos, homomórficos. 

A que corresponde essa operação de SU(2) é o problema que abordaremos agora, considerando casos especiais. 
Voltando à Equação (4.38), seja a = es e b = 0 ou 


ets 0 
U; = RE (4.47) 


Adiantando-nos à Equação (4.51), damos um índice inferior 3 a essa U. 
Executando uma transformação de similaridade unitária, Equação (4.43), em cada uma das três o de Pauli de 


SU(2), temos 
RE ets 0 0 1 eE 0 
PETN E E EAT 0 ef 


0 eis 
il ae g E (4.48) 


Expressamos esse resultado em termos das o; de Pauli, como na Equação (4.44), para obter 
Usxo1U) = xo; cos 2€ — rozsen2£. (4.49) 
De modo semelhante, 


Usyo2U} = yoisenZé + yoz cos 2€, 


U3203U] = 203. (4.50) 
Por essas expressões de ângulos duplos, vemos que temos de começar com um meio-ângulo: £ = a/2. Então, 
somando as Equações (4.49) e (4.50) e comparando com as Equações (4.44) e (4.45), obtemos 


x = x cosa + ysen a 

y =-—asena + y cos a (4.51) 
1 

D 


Zi 


A transformação unitária 2 x 2 usando U3(a) é equivalente ao operador de rotação R(a) da Equação (4.3). 


A correspondência de 
= cos8/2 sen 8/2 
U2(6) = sn E cos DO (4.52) 
e Ry(/) e de 


= (ù cosy/2 isen ọ/2 
Vie) = isen p/2 cosy/2 ) (8:28) 
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e Rı (4) resultam de maneira semelhante. Note que Ux (Y) tem a forma geral 
Up (1)) = 12 cos Y /2 + iopsen 1/2, (4.54) 


em que k = 1,2,3. 
A correspondência 


cosa sena O 


ia/2 0 
e 
Us(a) = e | -sena cosa 0 | =Ri(a) (4.55) 
0 eTia/2 
0 0 1 


não é uma simples correspondência um para um. Especificamente, assim como a em R, vai de O a 27, o parâmetro 
em U3, &@/2, vai de O a 7. Achamos 


Ri(a+ 27) = R.(a) 
—ejo/2 0 
Us(a + 27) = r S —U;(a). (4.56) 
Portanto, ambas, Us(a) e Us(a + 27) = —Us(a), correspondem a R. (a). A correspondência é 2 para 1 ou 


SU(2) e SO(3) são homomórficos. O estabelecimento da correspondência entre as representações de SU(2) e as 
de SO(3) significa que as representações conhecidas de SU(2) nos dão, automaticamente, as representações de 
SO(3). 


Combinando as várias rotações, constatamos que uma transformação unitária usando 


U(a, 8,7) = Us()U>(8)Us(a) (4.57) 


corresponde à rotação geral de Euler R.(y)R,(5)R.(a). Por multiplicação direta, 


' E eiv/2 0 cos8/2 sen 8/2 et2/2 0 
(an 8,7) = 0 ein? —sen 8/2 cos8/2 0 e~o 


el+a)/2 cos 8/2 eta) /2sen 8/2 
s | B/ | BRAN (4.58) 
—e~il-a)/2sen B/2 e tr+Ha)/2 cos 8/2 


Esta é nossa forma geral alternativa, Equação (4.38), com 


E= (y +a)/2, n=8/2, C=(y-0)/2. (4.59) 
Assim, pela Equação (4.58) podemos identificar os parâmetros da Equação (4.38) como 


a = + cos 6/2 
b = e=)/2sen 6/2. (4.60) 


Isospin SU(2) e Simetria de Sabor SU(3) 

A aplicação da teoria de grupos às partículas “elementares” foi denominada por Wigner como o terceiro estágio de 
teoria de grupos e física. O primeiro estágio foi a procura dos 32 grupos pontuais cristalográficos e dos 230 grupos 
espaciais que dão as simetrias cristalinas, Seção 4.7. O segundo estágio foi uma procura por representações como 
as de SO(3) e SU(2), Seção 4.2. Agora, neste estágio, os físicos estão de volta à procura de grupos. 

Nas décadas de 1930 a 1960 o estudo de partículas interagindo fortemente na física nuclear e na de altas energias 
levou ao grupo de isospin SU(2) e à simetria de sabor SU(3). Na década de 1930, após a descoberta do nêutron, 
Heisenberg propôs que as forças nucleares eram independentes de carga. A diferença entre a massa do nêutron e a 
do próton era de apenas 1,6%. Se essa pequena diferença de massa for ignorada, o nêutron e o próton podem ser 
considerados dois estados de carga (ou isospin) de um dubleto, denominado núcleon. Ao longo de z o isospin I 
tem projeção 173 = 1/2 para o próton e 73 = —1/2 para o nêutron. O isospin nada tem a ver com spin (o momento 
angular intrínseco de uma partícula), mas o estado de isospin a duas componentes obedece às mesmas relações 
matemáticas que o estado de spin 1/2. Para o núcleon, I = 7/2 são as usuais matrizes de Pauli e os estados de 
isospin +1/2 são autovetores da matriz de Pauli T3 = E Si De modo semelhante, os três estados de carga do 
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píon (7*,7º,7) formam um tripleto. O píon é a mais leve de todas as partículas de interação forte e é o portador 
da força nuclear a longas distâncias, muito semelhante ao fóton para a força eletromagnética. A interação forte dá 
tratamento semelhante aos membros dessas famílias de partículas, ou multipletos, e conserva isospin. A simetria é 
o grupo SU(2) de isospin. 

Tabela 4.1 Bárions com spin 5 paridade par 


Massa (MeV) Y I 15 


E 1321,32 -4 
= —] | 
se 2 
Z0 13149 +5 
ET 1197,43 -1 
E E° 1192,55 O 1 0 
E+ 1189,37 +1 
A A 1115,63 0 0 0 
n 939,566 — 
N 15 
p 938,272 + 


Na década de 1960, proliferaram partículas produzidas como ressonâncias por aceleradores. As oito mostradas 
na Tabela 4.1 atraíram particular atenção.” Os números quânticos conservados relevantes que são análogos e 
generalizações de L, e L? do SO(3) são Is e I? para isospin e Y para hipercarga. Partículas podem ser agrupadas 
em multipletos de carga ou de isospin. Então a hipercarga pode ser tomada como duas vezes a carga média do 
multipleto. Para o núcleon, isto é, o dubleto nêutron-próton, Y = 2. 5(0+ 1) = 1. Na Tabela 4.1 estão relacionados 
os valores de hipercarga e isospin para bárions como o núcleon e seus parceiros (aproximadamente degenerados). 
Eles formam um octeto, como mostra a Figura 4.3, depois do que a simetria correspondente passa a chamar-se 
caminho óctuplo. Em 1961, Gell-Mann e também Ne' eman (independentemente) sugeriram que a interação forte 
deveria ser (aproximadamente) invariante sob um grupo unitário especial tridimensional, SU(3) isto é, tem uma 
simetria de sabor SU(3). 


Dá 
4 
n p 
e +1 Q 
X ZA > 
—- + e, 
-1 —1/2 0 1/2 1d 
° -1 ° 


Figura 4.3: Diagrama de peso do octeto de bárions para SU(3). 


A escolha de SU(3) foi baseada, em primeiro lugar, nos dois números quânticos conservados e independentes, 
Hı = I3e Hə = Y (isto é, geradores com [13,Y] = 0, que não sejam invariantes de Casimir; veja o sumário 
na Seção 4.3) que pedem um grupo de ordem (posto) 2. Em segundo lugar, o grupo devia ter uma representação 
octodimensional para dar conta dos bárions quase degenerados e quatro octetos similares para os mésons. De certa 
forma, SU(3) é a generalização mais simples do isospin SU(2). Três de seus geradores são matrizes hermitianas 


STodas as massas são dadas em unidades de energia, 1 MeV = 10º ev. 
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3 x 3 de traço zero que contêm as matrizes 2 x 2 de isospin de Pauli 7; no canto superior esquerdo, 


Ti 
À; = O dis W2: (4.6la) 
0 0 0 
Assim, o grupo de isospin SU(2) é um subgrupo do SU(3) de sabor com 13 = As/2. Quatro outros geradores 


têm os 1 fora da diagonal de 71, e —i,i de T2 em todas as outras localizações possíveis para formar matrizes 
hermitianas 3 x 3 de traço nulo. 


0 01 0 0 ci 
‘=| 000], à=ļ|00 0], 
100 io o 
(4.61b) 
000 0 0 0 
à=] 0011, M=|0 0 ci 
010 0 0 


O segundo gerador diagonal tem a matriz unidade bidimensional 1, no canto superior esquerdo, o que o torna 
claramente independente do subgrupo SU(2) de isospin por causa de seu traço não-nulo naquele subespaço, e —2 
no terceiro lugar da diagonal, o que o torna de traço nulo. 


1 0 0 
1 
Àg = — 0 1 0 i 4.6lc 
8 NE ( ) 
0 0 —2 


Ao todo há 3? — 1 = 8 geradores para SU(3), que tem ordem 8. As constantes de estrutura de SU(3) podem ser 
obtidas com facilidade dos comutadores desses geradores. 

Voltando à simetria de sabor SU(3), imaginamos que o hamiltoniano para nossos oito bárions seja composto de 
três partes: 


H = Hforte + Hmédio + Heletromagnético: (4.62) 


A primeira parte, Hforte» tem a simetria SU(3) e leva à degeneração óctupla. A introdução do termo que rompe 
a simetria Médio remove parte da degeneração dando massas diferentes aos quatro multipletos de isospin 
(27,20), (£7, £0, 5+), A, e N = (p,n). Esses ainda são multipletos porque H médio tem simetria SU(2) de 
isospin . Por fim, a presença de forças dependentes de carga subdivide os multipletos de isospin e remove a última 
degenerescência. Essa seqüência imaginada é mostrada na Figura 4.4. 


massa 


N 


H, 
Horte Hrorte + e o 
+Hmédio + Heletromagnético 


Figura 4.4: Subdivisão da massa do bárion. 


A representação por octeto não é a representação mais simples de SU(3). As representações mais simples são 
as triangulares mostradas na Figura 4.5, das quais todas as outras podem ser geradas por acoplamento generalizado 
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de momento angular (veja a Seção 4.4 sobre quadros de Young). A representação fundamental na Figura 4.5a 
contém os quarks u (up), d (down) e s (estranho), e a Figura 4.5b contém os antiquarks correspondentes. Uma 
vez que octetos de mésons podem ser obtidos das representações de quarks como qq, com 32 = 8 + 1 estados, 
isso sugere que mésons contêm quarks (e antiquarks) como seus constituintes (veja o Exercício 4.4.3). O modelo 
de quark resultante dá uma bem-sucedida descrição de espectroscopia hadrônica. A resolução de seu problema 
com o princípio de exclusão de Pauli resultou eventualmente na teoria de calibre de SU(3) cor da interação forte 
denominada cromodinâmica quântica (QCD). 


Y Y 
A A 
54 23 
> L 
+ + > 1 
a 1/2 3 
Fi -1/3 d 
a D 


Figura 4.5: (a) Representação fundamental de SU(3), o diagrama de pesos para os quarks u, d, s; (b) diagrama de 
pesos para os antiquarks ù, d, 5. 


Para manter a teoria dos grupos e suas proezas muito reais sob uma perspectiva adequada, devemos enfatizar 
que ela identifica e formaliza simetrias. Classifica (e às vezes prevê) partículas. Mas, exceto por afirmar que uma 
parte do hamiltoniano tem simetria SU(2) e uma outra parte tem geometria SU(3), a teoria dos grupos nada diz 
sobre a interação de partículas. Lembre-se de que declarar que o potencial atômico é esfericamente simétrico nada 
nos diz sobre a dependência radial do potencial ou da função de onda. Ao contrário, em uma teoria de calibre, 
a interação é mediada por bósons vetoriais (como o fóton na eletrodinâmica quântica) e unicamente determinada 
pela derivada covariante de calibre (veja a Seção 1.13). 


Exercícios 

4.2.1 (1) Mostre que as matrizes de Pauli são os geradores de SU(2) sem usar a parametrização da matriz 
2 x 2 unitária geral na Equação (4.38). (ii) Derive os oito geradores independentes À; de SU(3) de 
maneira semelhante. Normalize esses geradores de modo que tr(A;A;) = 20;;. Então determine as 
constantes estruturais de SU(3). 
Sugestão: As A; têm traço nulo e são matrizes hermitianas 3 x 3. 
(iii) Construa a invariante quadrática de Casimir de SU(3). 
Sugestão: Trabalhe por analogia com o? + o3 + o2 de SU(2) ou L? de SO(3). 


4.2.2 Prove que a forma geral de uma matriz 2 x 2 unitária unimodular é 


U= 
—b* at 
com a*a + b*b = 1. 


4.2.3 Determine três subgrupos SU(2) de SU(3). 
4.2.4 Um operador de translação T'(a) converte y(x) a y(x + a), 


Tla)y(a) = bla + a). 


Em termos do operador de momento linear (mecânica quântica), py = —id/dax, mostre que 
T(a) = exp(iaps.), isto é, py é o gerador de translações. 
Sugestão: Expanda (a + a) como uma série de Taylor. 
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4.2.5 Considere que a equação de elemento geral de SU(2), Equação (4.38), seja composta de três 
rotações de Euler: (i) uma rotação de a/2 ao redor do eixo z, (ii) uma rotação de b/2 ao redor 
do novo eixo x, e (iii) uma rotação de c/2 ao redor do novo eixo z. (Todas as rotações são em 
sentido anti-horário.) Usando os geradores o de Pauli, mostre que esses ângulos de rotação são 
determinados por 

a= -+5 =a+5 
c= E+Ç-3 =F 
Nota: Aqui, os ângulos a e b não são o a e b da Equação (4.38). 


4.2.6 Rotacione uma função de onda não-relativista y% = (Yy, Y 1) de spin 1/2 ao redor do eixo z por um 
ângulo pequeno d0. Ache o gerador correspondente. 


4.3 Momento Angular Orbital 


O conceito clássico de momento angular, Lciass = r X p, é apresentado na Seção 1.4 para introduzir o produto 
vetorial. Seguindo a representação usual de Schrôdinger da mecânica quântica, o momento linear clássico p é 
substituído pelo operador —iWV. O operador de momento angular orbital na mecânica quântica se torna” 


Lom = -ir x V. (4.63) 


Isso é usado repetidas vezes nas Seções 1.8, 1.9 e 2.4 para ilustrar operadores diferenciais vetoriais. Pelo Exercício 
1.8.8 as componentes do momento angular satisfazem as relações de comutação 


[Li, Lj] = i£ijk Lk. (4.64) 


O c;;k é o símbolo de Levi-Civita da Seção 2.9. Fica subentendido o somatório sobre o índice k. 
O operador diferencial correspondente ao quadrado do momento angular 


L? =L- L= L +L +r? (4.65) 


pode ser determinado por 
L- L= (r x p): (r x p), (4.66) 


que é o assunto dos Exercícios 1.9.9 e 2.5.17(b). Visto que L2, sendo um produto escalar, é invariante sob rotações 
isto é, um escalar rotacional, esperamos que [L2, L;] = 0, o que também pode ser verificado diretamente. 

A Equação (4.64) apresenta as relações de comutação básicas das componentes do momento angular da 
mecânica quântica. De fato, dentro da estrutura da mecânica quântica e da teoria dos grupos, essas relações de 
comutação definem um operador de momento angular. Nós as usaremos agora para construir os auto-estados do 
momento angular e achar os autovalores. Para o momento angular orbital, eles são os harmônicos esféricos da 
Seção 12.6. 


Abordagem do Operador de Levantamento e Abaixamento 


Vamos começar com uma abordagem geral, na qual o momento angular J que consideramos pode representar um 
momento angular orbital L, um spin o /2 ou um momento angular total L + o /2 etc. Admitimos que 
1. J é um operador hermitiano cujas componentes satisfazem as relações de comutação. 


[Ji, Jj] = i£ijk Jk, [J?, Ji] = 0. (4.67) 


Caso contrário, J é arbitrário. (Veja o Exercício 4.3.1.) 
2. |AM) é simultaneamente uma autofunção normalizada (ou autovetor) de J; com M e uma autofunção” de J?, 


JAAM) = MIAM),  PIAM)= MAM),  (AM]AM) =1. (4.68) 


6Por simplicidade, igualamos A a 1. Isso significa que o momento angular é medido em unidades de h. 

"Que |AM) pode ser uma autofunção de ambos, Jz, e J2, resulta de [J., J2] = O na Equação (4.67). Para SU(2), (AM|AM) é o produto 
escalar (dos vetores ou spinores bra e ket) na notação braket introduzida na Seção 3.1. Para SO(3), |AM) é uma função Y (0, p) eJAM?) 
é uma função Y’ (0, p) e o elemento de matriz (AM|AM”) = Es Soco Y*(0,9)Y'(0, p)sen 6 do dy é a sobreposição delas. Todavia, 
em nossa abordagem algébrica, apenas a norma na Equação (4.68) é usada e elementos matriciais dos operadores de momento angular são 
reduzidos à norma por meio da equação de autovalor para Jz, Equação (4.68) e Equações (4.83) e (4.84). 
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Agora mostraremos que À = J(J + 1) e então acharemos outras propriedades de |AM). O tratamento ilustrará 
a generalidade e o poder de técnicas de operador, em particular a utilização de operadores de levantamento e 
abaixamento.º 

Os operadores de levantamento e abaixamento são definidos como 


Ji = Jet idy J= dp ty: (4.69) 
Em termos desses operadores, J? pode ser reescrito como 
J? = JJ + J-J4) + J2. (4.70) 


Pelas relações de comutação, Equação (4.67), encontramos 


Ja J] =+ a J]=-J, Jp J]= 2J. (4.71) 


Uma vez que J} comuta com J? (Exercício 4.3.1), 
J? (JAM) = (SAM) = A(JEAM)). (4.72) 


Por conseguinte, J, |AM) é ainda uma autofunção de J? com autovalor À e, de modo semelhante, para J—|AM)}. 
Mas, pela Equação (4.71), 
JJ, = J4 (Jz +1), (4.73) 


ou 
TJAM) = J4 (J; + DIAM) = (M + 1) J4 AM). (4.74) 


Portanto, J, |AM) ainda é uma autofunção de J, mas com autovalor M + 1. J} elevou o autovalor de 1 e, por 
isso, é denominado operador de elevação. De modo semelhante, J— diminui o autovalor de 1 e é denominado 
operador de rebaixamnto. 

Tomando valores esperados e usando Ji =a Ji = Jy, obtemos 


(AMIJI? — J2AM) = (AM|IZ + J2AM) = [JAM + |J AM)? 
e vemos que À — M? > 0, portanto, M tem um limite. Seja J o maior M. Então, J} |AJ) = 0, o que implica 
J-J4|AJ) = 0. Daí, combinando as Equações (4.70) e (4.71) para obter 

J? = J J} + JJ: +1), (4.75) 


constatamos, pela Equação (4.75), que 


0 = J-A) = (I? -— J? = JAA) = (A — J? -= J) AJ). 


Portanto, 
A=J(J+1)>0, (4.76) 
com J não-negativo. Agora renomeamos os estados |AM) = |J M}. De modo semelhante, seja J’ o menor M. 
Então, J—|JJ'} = 0. Por 
JP = JJ- + JJ- 1), (4.77) 
vemos que 
0 = J4 J-|IJ') = (I? + J; = JIII = (A+ F = PII. (4.78) 
Daí, 
A\=J(J+1)= J(I —1)=(-J)(-J — 1). 
Portanto, J' = —J, e M varia em passos inteiros de —J a +J, 


-“-J<M<I. (4.79) 


8Operadores de levantamento e abaixamento podem ser desenvolvidos para outras funções matemáticas. Compare com a subseção seguinte, 
sobre grupos de Lie, e com a Seção 13.1, para os polinômios de Hermite. 
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Começando de | JJ) e aplicando J— repetidas vezes, chegamos a todos os outros estados |J M). Por conseguinte, 
|JM) forma uma representação irredutível de SO(3) ou SU(2); M varia e J é fixo. 
Então, usando as Equações (4.67), (4.75) e (4.77) obtemos 


ITAIM) = [JI(J +1) — M(M + 1)||JM) = (J —- M)\(J + M + 1)|JM)}, a 
LJ AIM) = [J(J +1) — M(M — 1)||JM) = (J+ M)(J — M + 1)|JM). l 
Como J} e J. são conjugados hermitianos,? 
A, Ji = J}, (4.81) 


os autovalores na Equação (4.80) devem ser positivos ou zero.!? Alguns exemplos da Equação (4.81) são dados 
pelas matrizes dos Exercícios 3.2.13 (spin 1/2). Alguns exemplos da Equação (4.81) são dados pelas matrizes dos 
Exercícios 3.2.13 (spin 1/2), 3.2.15 (spin 1) e 3.2.18 (spin 3/2). Para os operadores de levantamento e abaixamento 
de momento angular orbital, L} e L—, são dadas formas explícitas nos Exercícios 2.5.14 e 12.6.7. Agora você pode 
mostrar (veja também o Exercício 12.7.2) que 


(JM|J-(J4|JMY) = (J+|J MY) TIM). (4.82) 


Uma vez que J} eleva o autovalor M para M + 1, denominamos a autofunção resultante |JM + 1). A 
normalização é dada pela Equação (4.80) como 


JIM = VJ- MJ +M + D|JM +1) = VIJ +F- M(M+I|JM +1), (4.83) 


tomando a raiz quadrada positiva e não introduzindo nenhum fator de fase. Pelos mesmos argumentos, 


J_|JM) = (J+ M)(J =M +1D)|JM — 1) = /(J(J +1) -= M(M = 1)|JM — 1). (4.84) 


Aplicando J, à Equação (4.84), obtemos a segunda linha da Equação (4.80) e verificamos que a Equação (4.84) é 
consistente com a Equação (4.83). 

Por fim, visto que M vai de — J a +J em passos unitários, 2J deve ser um inteiro; J é um inteiro ou metade de 
um inteiro ímpar. Como veremos mais adiante, se J é um momento angular orbital L, o conjunto |LM) para todo 
M é uma base que define uma representação de SO(3) e, então, L será inteiro. Em coordenadas polares esféricas 
0, p, as funções |[LM) tornam-se os harmônicos esféricos Y 7! (0, p) da Seção 12.6. Os conjuntos de estados |J M} 
com J da metade do inteiro definem representações de SU(2) que não são representações de SO(3); obtemos 
J = 1/2,3/2,5/2,.... Nosso momento angular é quantizado essencialmente como um resultado das relações de 
comutação. Todas essas representações são irredutíveis, como sugere uma aplicação dos operadores de elevação e 
rebaixamento. 


Resumo de Grupos de Lie e Algebras de Lie 
As relações gerais de comutação, Equação (4.14) na Seção 4.2, para um clássico grupo de Lie [SO(n) e SU(n) 
em particular], podem ser simplificadas para ficar mais parecidas com a Equação (4.71) para SO(3) e SU(2) nesta 
seção. Aqui, estamos fazendo uma mera revisão e, como regra, não apresentamos provas para vários teoremas que 
explicamos. 

Em primeiro lugar escolhemos geradores linearmente independentes e mutuamente comutativos H; que são 
generalizações de J, para SO(3) e SU(2). Seja | o número máximo de tais H; com 


[H;, Hx] = 0. (4.85) 


Então, l é denominado grau do grupo de Lie G ou sua álgebra de Lie G. O grau e a dimensão, ou ordem, de alguns 
grupos de Lie são dados na Tabela 4.2. Pode-se demonstrar que todos os outros geradores Ea são operadores de 
elevação e rebaixamento em relação a todos os H;, portanto, 


[Hi Ea] = &;Ea, i=1,2...,l (4.86) 


º A conjugação hermitiana ou operação adjunta é definida para matrizes na Seção 3.5, e para operadores em geral, na Seção 10.1. 
10Se quiser uma excelente discussão sobre operadores adjuntos e espaços hilbertianos, consulte A. Messiah, Quantum Mechanics. Nova 
York: Wiley (1961), Capítulo 7. 
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O conjunto dos denominados vetores raízes (01,09,...,01) forma o diagrama raiz de G. 

Quando os H; comutam, eles podem ser simultaneamente diagonalizados (para matrizes simétricas (ou 
hermitianas), veja o Capítulo 3; para operadores, veja o Capítulo 10). Os H; nos dão um conjunto de autovalores 
ma,ma,...,my [números quânticos de projeção ou aditivos generalizando M de J, em SO(3) e SU(2)]. O 
conjunto dos denominados vetores de peso (M1, M2,..., Mı) para uma representação irredutível (multipleto) 
forma um diagrama de peso. 


Tabela 4.2 Grau e ordem de grupos unitários e rotacionais 


Álgebra de Lie A; Bı Dı 
Grupo de Lie  SU(L+1) SO(21+1) SO(2]) 
Grau l l l 
Ordem (+ 2) (21 +1) (21-1) 


Há l operadores invariantes C;, denominados operadores de Casimir, que comutam com todos os geradores e 
são generalizações de J?, 


[C H; =0, [Cn Ea] =0,  i=1,2,...,L (4.87) 


O primeiro, C1, é uma função quadrática dos geradores; os outros são mais complicados. Uma vez que os 
C; comutam com todos os Hj, eles podem ser diagonalizados simultaneamente com os Hj. Seus autovalores 
C1, C2, . . . , Œ Caracterizam representações irredutíveis e permanecem constantes enquanto o vetor de pesos varia 
sobre qualquer representação irredutível particular. Assim, a autofunção geral pode ser escrita como 


[(c1, c25- - mama, mu), (4.88) 


generalizando o multipleto |J M) de SO(3) e SU(2). Suas equações de autovalor são 


Hil(ca, Cos MAM, Mm) = mille, C2, G )M1, Mo,- , M1) (4.89a) 
Ci|(c1, e». cm M2,- m) = cil (c1, cos c)maimo,.. mY. (4.89b) 
Agora podemos mostrar que Esl(c1,c5,...,co)mi,mo,...,my) tem o vetor de pesos (my + ay,ma + 
Q2, ..., Mı + ay) usando as relações de comutação, Equação (4.86), em conjunção com as Equações (4.89a) e 
(4.89b): 
Ea|( (c1, C25... COMA, Ma, ..., MU) 
= (Ea H;i + [Hi, Bol) |(c1,c2,...,c)ma,moa,...,mu) 
= (mi; + a;) Ea (c1, Ca, CM; ma,.. mu). (4.90) 
Portanto, 
Eol(c1, e»... c)mama,.. mu) rá [eis ema +a... m + a), 


a generalização das Equações (4.83) e (4.84) de SO(3). Essas mudanças de autovalores pelo operador Ea são 
denominadas suas regras de seleção em mecânica quântica. Elas são exibidas no diagrama-raiz de uma álgebra de 
Lie. 

Exemplos de diagramas-raiz para SU(2) e SU(3), são dados na Figura 4.6. Se ligarmos as raízes denotadas por 
setas na Figura 4.6b a um peso nas Figuras 4.3 ou 4.5a, b, podemos chegar a qualquer outro estado (representando 
po um ponto no diagrama de pesos). 

Aqui, o lema de Schur se aplica: um operador H que comuta com todos os operadores de grupo e, portanto, 
com todos os geradores H; de um determinado grupo (clássico) de Lie G tem como autovetores todos os estados 
de um multipleto e é degenerado com o multipleto. Como consegiiência, esse operador comuta com todos os 
invariantes de Casimir, [H,C;] = 

O último resultado é claro porque os invariantes de Casimir são construídos a partir de geradores e operadores 
de elevação e abaixamento do grupo. Para provar o restante, seja Y um autovetor, Hb = Ey. Então, para qualquer 
rotação R de G, temos H Ry = E Ry, que diz que Ry é um auto-estado com o mesmo autovalor E juntamente 
com 1). Uma vez que [H, C;] = 0, todos os invariantes de Casimir podem ser diagonalizados simultaneamente com 
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Figura 4.6: Diagrama-raiz para (a) SU(2) e (b) SU(3). 


H e um auto-estado de H é um auto-estado de todos os C;. Visto que [H;, C;] = 0, os auto-estados rotacionados 
Ry são autoestados de C;, juntamente com Y pertencentes ao mesmo multipleto caracterizado pelos autovalores 
ci de Ci. 

Por fim, esse operador H não pode induzir transições entre diferentes multipletos do grupo porque 


(es; res) Mamas se ., m| H |(c1, c2, Z SM Ma... Ma) =0. 
Usando [H, C';] = 0 (para qualquer j) temos 


0= (ci Go cs c)mi mo. mi lH, Clerc»... ema, ma, ...,mm) 


= (c; — (A Ss c)mima,...,miHI(e1, co... ,c)mamo,..., mu). 


Se Ci Æ cj para alguns j, segue-se a equação precedente. 


Exercícios 
4.3.1 Mostre que (a) [J,,J2] = 0, (b) [J—, J?] = 0. 
4.3.2 Derive o diagrama-raiz de SU(3) na Figura 4.6b a partir dos geradores À; na Equação (4.61). 
Sugestão: Elabore primeiro o caso SU(2) na Figura 4.6a a partir das matrizes de Pauli. 


4.4 Acoplamento de Momento Angular 


Em sistemas de muitos corpos da mecânica clássica, o momento angular total é o somatório L = J; L; 
dos momentos angulares orbitais individuais. Qualquer partícula isolada tem momento angular conservado. Na 
mecânica quântica, o momento angular conservado surge quando partículas se movimentam em um potencial 
central, tal como o potencial de Coulomb na física atômica, um potencial de modelo de camada em física nuclear 
ou um potencial de confinamento de um modelo de quark na física de partículas. Na equação relativística de Dirac, 
o momento angular orbital já não é mais conservado, porém J = L + S é conservado, com o momento angular 
total de uma partícula consistindo em seu momento angular orbital e intrínseco, denominado spin S = o /2, em 
unidades de A. 

Pode-se mostrar de imediato que a soma de operadores de momento angular obedece às mesmas relações de 
comutação na Equação (4.37) ou na Equação (4.41) que os operadores individuais de momento angular, contanto 
que os operadores de partículas diferentes comutem. 


Coeficientes de Clebsch-Gordan: SU(2)-SO(3) 


É claro que a combinação de dois momentos angulares comutativos J; para formar sua soma 
J=J +), [Ji Ja] = 0, (4.91) 
ocorre com fregiiência em aplicações e J satisfaz as relações de comutação do momento angular 
[J;, Je] = [Jij + Jo, Jik + Jo] = [hj, Jik] + [J25, Jos] = iejri (Jiu + Ja) = i£jkiJi- 


O momento angular total para uma partícula única com spin 1/2, por exemplo, um elétron ou um quark, é uma 
soma do momento angular orbital e do spin. O momento angular orbital total para duas partículas sem spin é 


“livro” — 2007/8/1 — 15:06 — page 203 — #213 


ELSEVIER. 4. TEORIA DOS GRUPOS 203 


L = L; + Lo. Para que J? e J, da Equação (4.91) sejam ambos diagonais, [J2, J.] = O tem de ser válida. Para 
demonstrar isso, usamos as óbvias relações de comutação [J;., J3] =0e 


J? = J? + J2 +21 -Jo = J? + J2 + JJ + J-J + 2J J22 (4.91) 
em conjunção com a Equação (4.71), para ambos J;, para obter 


[P,J,)=[h- Jo + J14J2-, Jiz + J22] 
= [dias Stela + dio [dog J22] + [i+ diz dare Fifa J22] 
= Ji Jos = Jj- Jos = Jp Jo- + Ji Jo- = 0. 


De maneira similar, provamos [J2, J?] = 0. Por conseguinte, os autovalores de J2, J2, J; podem ser usados para 


KA 
rotular os estados de momento angular total | Jı J2 JM). 
Os estados do produto |Jjm1)|J;m») obviamente satisfazem as equações de autovalor 


JlJhma)| Soma) = (Jiz + Jo) Jimi} Soma) = (ma + mo)|Jima)| Jomo) 
= M|Jima)|Jomo), (4.92) 
J? |Jim) Jomo) = Ji(J; + D|Jima)| Jomo), 


mas não terão J? diagonal exceto para os estados extremos com M = +(Jh + J2) e J = Jı + Jo (veja a Figura 
4.7a). Para ver isso usamos a Equação (4.91) mais uma vez, em conjunção com as Equações (4.83) e (4.84) em 


A 4 4 
J, 
J 2 
3 i 


Ji 


a b c 


Figura 4.7: Acoplamento de dois momentos angulares: (a) paralelo, (b) antiparalelo, (c) caso geral. 


SP | Jima) Jamo) = E H(J +1) + J2(J2 + 1) + 2mm} |Jim} |J2m2) 
EAD ED PED mata DP 


1/2 
x |Jımı + 1)|Jzm2 — 1) + {3 (J1 + 1) - mam — DN” 
1/2 
x {Ja(J2 +1) — ma(mz + 1)} |Jim — 1)|J2m2 + 1). (4.93) 
Os dois últimos termos na Equação (4.93) desaparecem somente quando mı = Jı e m2 = Jz ou mı = —J e 
mə = — J2. Em ambos os casos J = Jı + Jo resulta da primeira linha da Equação (4.93). Por conseguinte, em 


geral, temos de formar combinações adequadas de estados de produto 


|J2JM)= 35 A hJmmaM)|Juma)| Jomo), (4.94) 


mi;ma 


de modo que J? tenha autovalor J(J-+1). As quantidades C (J, J2 J|mı Mz M) na Equação (4.94) são denominadas 
coeficientes de Clebsch-Gordan. Pela Equação (4.92) vemos que eles desaparecem a menos que M = my + ma, 
reduzindo a soma dupla a uma soma única. Aplicar J+ a |JM) mostra que os autovalores M de J, satisfazem as 
desigualdades usuais —J < M < J. 

É claro que o máximo Jmáx = Jı + Jo (veja a Figura 4.7a). Nesse caso, a Equação (4.93) se reduz a um estado 
de produto puro. 


lhJoJ = Ji + JM = Jı + Jo) = lh JJ do), (4.95a) 
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portanto, o coeficiente de Clebsch-Gordan 
C(ai zJ = Jı + JhJhh+ J2) = 1. (4.95b) 


O mínimo J = Jı — Jo (se Jı > Jo, veja a Figura 4.7b) e J = Jo — Jı para Jo > Jı resulta se mantivermos em 
mente que há exatamente tantos produtos de estado quanto estados | JM), isto é, 


Jmáx 
a (2J + 1) = (Jmáx = Jmín gn 1)(Jmáx + Jmín F 1) 
J=Jmín 


= (0h + 1)(2J2 + 1). (4.96) 


Essa condição é válida porque os estados | Jı J2 JM} são apenas um rearranjo de todos os estados de produto na 
forma de representações irredutíveis de momento angular total. E equivalente à regra do triângulo: 


A(h JJ) =1, se |J — Jo| <J < J+J; 


(4.97) 
A(JıJ2J) = 0, se não for. 


Isso indica que um multipleto completo de cada valor J de Jimín a Jmáx dá conta de todos os estados e que todos os 
estados |J M} são necessariamente ortogonais. Em outras palavras, a Equação (4.94) define uma transformação 
unitária a partir do conjunto de produtos de base ortogonal de estados de partícula única |Jımı; Jomo) = 
[Jima)|Joms) para os estados de duas partículas | Jı J2 JM). Os coeficientes de Clebsch-Gordan são exatamente 
os elementos da matriz de sobreposição. 


C(JiJzJ|mim M) = (A JoJM|Jyma; Jomo). (4.98) 


A construção explícita no que segue mostra que eles são todos reais. Os estados na Equação (4.94) são 
ortonormalizados, contanto que as restrições 


C(JıJ2J|mmM)C (Ji J2] | mim M") 
mma, mı +Mm2=M (4.99a) 
— (AH JJM| J J2J' M") = ô JJ ÔMM' 


5 C(JıJzJ|mmM)C (Jı J2J|m mM) 
TM (4.99b) 
= (Jma|Jimi)(Jama|Joms) = ômim! ômoms 


sejam válidas. 

Agora estamos prontos para construir mais diretamente os estados de momento angular total partindo de 
Jmáx= Jı + J2 M = Jı + J2} na Equação (4.954) e usando o operador de rebaixamento J- = Jı- + Jo 
repetidas vezes. Na primeira etapa usamos a Equação (4.84) para 

In (RIA = hE CITA, 
que substituímos em (A - + Jo-)|Ah J)|Jo Jo). Normalizando o estado resultante com M = Jı + J2 — 1 
adequadamente para 1, obtemos 
1/2 
[JJJ + JJ + J2- 1) = {h/h + J2)} / [J — 1}|J2J2) 
1/2 

+ (JJ + J2)} i [JJl J2J2 — 1). (4.100) 

A Equação (4.100) dá os coeficientes de Clebsch-Gordan 


okee e A ei EA ren ETA 


CR a E 


Então aplicamos J— mais uma vez e normalizamos os estados obtidos até alcançarmos |Jı J2 Jı + J2 M} com 
M = —(J+J). Desse modo, os coeficientes de Clebsch-Gordan C (Jı Jo J1+J2|Mı M2 M) podem ser calculados 
etapa a etapa e são todos reais. 
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A próxima etapa é perceber que o único outro estado com M = Jı + J2 — 1 é o topo da próxima torre mais 
baixa de estados [Ji + Jo — 1M). Visto que |Jı + J2 — 1 Jı + J2 — 1) é ortogonal a |Jı + J2 Jı + Jo — 1) na 
Equação (4.100), ele deve ser a outra combinação linear com um sinal de menos relativo. 


pet eis ie 
KIRNA + IP Pd) dada — 1), (4.102) 


até um sinal geral. 
Por conseguinte, determinamos os coeficientes de Clebsch-Gordan (para Jo > Jı) 


Cid Fe dh ss Ele iai 
Code dae Ss E E E 
Mais uma vez, continuamos a usar J.. até alcançarmos M = —(J + J2 — 1), e continuamos normalizando os 


estados resultantes | + J2 —1M) da torre J = Jı + J2 — 1. 

Para chegar ao topo da torre seguinte, | J1 + J2 —2 M} com M = Jı + Jo —2, lembramos que já construímos dois 
estados com aquele M. Ambos, | +J2J1+J2—2) e |J1+J2—1 Jı +J2—2), são combinações lineares conhecidas 
dos três estados de produto | J1 J1)| J2 J2 — 2), |J1 Jı — 1) x |J2J2 — 1), e a menos de |J1 Jı — 2)| J2 J2). A terceira 
combinação linear é fácil de achar pela ortogonalidade desses dois estados, até uma fase geral, que é escolhida pelas 
convenções de fase de Condon-Shortley!! de modo que o coeficiente C (Jı J2 Jı + J2 — 2| J1 J2 — 2 Jı + Jo — 2) 
do último estado de produto é positivo para |Jı J2 Jı + J2 — 2 Jı + J2 — 2). É direto, embora um pouco tedioso, 
determinar o restante dos coeficientes de Clebsch-Gordan. 

Numerosas relações de recorrência podem ser derivadas de elementos matriciais de vários operadores de 
momento angular, para as quais nos referimos, à literatura. !? 

As propriedades de simetria dos coeficientes de Clebsch-Gordan são mais bem exibidas nos símbolos 3; de 
Wigner mais simétricos, que são tabulados: 


a E 4.104 
PR da e iii 


obedecendo às relações de simetria 


JJoJ: Je 
RS RS Rr Bk ; (4.104b) 


mMım2m3 MEMIMnyn 


para (k,l, n) uma permutação ímpar de (1, 2,3). Um dos lugares mais importantes em que aparecem os coeficientes 
de Clebsch-Gordan é em elementos matriciais de operadores tensoriais, que são governados pelo teorema de 
Wigner-Eckart discutido na próxima seção, sobre tensores esféricos. Um outro é o acoplamento de operadores ou 
vetores de estado a momento angular total, tal como um acoplamento spin-órbita. Reacoplar operadores e estados 
em elementos matriciais leva a símbolos 6j e 97. Coeficientes de Clebsch-Gordan podem ser, e são, calculados 
para outros grupos de Lie, tal como SU(3). 


Tensores Esféricos 

No Capítulo 2, as propriedades de tensores cartesianos são definidas usando o grupo de transformações lineares 
gerais não-singulares, que contém as rotações tridimensionais como um subgrupo. Um tensor de uma dada 
ordem que é irredutível em relação ao grupo total pode perfeitamente tornar-se redutível para o grupo de rotação 
SO(3). Para explicar este ponto, considere o tensor de segunda ordem com Tjk = x;y, para j,k = 1,2,3. Ele 
contém o tensor simétrico Sj = (x;yk + vky;)/2 e O tensor anti-simétrico Ajk = (x;yk — £kyYj)/2, portanto 
Tjk = Sjk + Asp. Isso reduz Tjg em SO(3). Contudo, sob rotações o produto escalar x - y é invariante e, por 


HE, U. Condon e G. H. Shortley, Theory of Atomic Spectra. Cambridge, UK: Cambridge University Press (1935). 

2 Há uma rica literatura sobre esse assunto, por ex., A. R. Edmonds, Angular Momentum in Quantum Mechanics. Princeton, NJ: Princeton 
University Press (1957); M. E. Rose, Elementary Theory of Angular Momentum. Nova York: Wiley (1957); A. de-Shalit e I. Talmi, Nuclear 
Shell Model. Nova York: Academic Press (1963); Dover (2005). Coeficientes de Clebsch-Gordan são tabulados em M. Rotenberg, R. Bivins, 
N. Metropolis e J. K. Wooten, Jr., The 3j- and 6j-Symbols. Cambridge, MA: Massachusetts Institute of Technology Press (1959). 
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conseguinte, é irredutível em SO(3). Assim, S; pode ser reduzido por subtração do múltiplo de x - y que o torna 
sem traço. Isso leva ao tensor irredutível SO(3) 


Sk = (ay + TkYj) — 5x “Yôjk- 


Tensores de ordens mais altas podem ser tratados de maneira semelhante. Quando formamos tensores a partir 
de produtos das componentes do vetor de coordenadas r, então, em coordenadas polares que são talhadas para a 
simetria SO(3), terminamos com os harmônicos esféricos do Capítulo 12. 

A forma dos operadores de levantamento e abaixamento para SO(3) na Seção 4.3 nos leva a introduzir as 
componentes esféricas (note, todavia, a normalização e os sinais diferentes prescritos pelos Y;m) de um vetor A: 


Ap =- (4s il), Aa = (Acid), Ao = A. (4.105) 


Então, para o vetor de coordenadas r em coordenadas polares, temos, 


E ip — p, [4m A =p = p, / 4r 
r41 = —Sgrsen bet? = ry] Yn, ra = arsende VP = ry F Yi, -1 


= 47 
ro=1/5 Yio, 


em que Y;m(0,y) são os harmônicos esféricos do Capítulo 12. Mais uma vez, as componentes esféricas jm dos 
tensores Tjm de ordem mais alta j podem ser introduzidas de modo semelhante. 

Um operador tensorial esférico T';m irredutível de ordem j tem 2j + 1 componentes, exatamente como os 
harmônicos esféricos e m varia de —j a +j. Sob uma rotação R(a), a representa os ângulos de Euler, os Yim se 
transformam em 


(4.106) 


MPE Va) a (RO: (4.107a) 


onde ?” = (0",!) são obtidos de ? = (0, p) pela rotação R e são os ângulos do mesmo ponto no referencial 
rotacionado, e 
Di ml, 8,7) = (Jml exp(iaJ.) exp(iß Jy) expliyJ.)|Jm') 


são as matrizes de rotação. Portanto, para o operador Tm, definimos 


RTim R! = X ED alo): (4.107b) 
Para uma rotação infinitesimal (veja a Equação (4.20) na Seção 4.2 sobre geradores), o lado esquerdo da 


Equação (4.107b) é simplificado para um comutador e o lado direito para os elementos matriciais de J, o gerador 
infinitesimal da rotação R: 


Das Tim] =D Tijm (jm | Salim): (4.108) 
Se substituirmos nas Equações (4.83) e (4.84) os elementos matriciais de Jm, obteremos as leis alternativas de 
transformação de um operador tensorial 


1/2 


[do Tim] =MTjm  [J£+, Tim] = Timz1{ (j — Mm)(j +m +1)} (4.109) 

Podemos usar os coeficientes de Clebsch-Gordan da subseção anterior para acoplar dois tensores de uma dada 

ordem a uma outra ordem. Um exemplo é o produto externo ou vetorial de dois vetores a e b no Capítulo 1. Vamos 

escrever ambos os vetores em componentes esféricas am € bm. Então, verificamos que o tensor Cm de ordem 1 é 
definido como 


i 
Cm = >, C(Mmmamam, bm, = a x D)m. (4.110) 


Uma vez que Cm é um tensor esférico de ordem 1, linear nas componentes de a e b, ele deve ser proporcional 
ao produto vetorial Cm = N(a x b)m. A constante N pode ser determinada a partir de um caso especial, 
a = å, b = y, em essência, escrevendo X x y = Z em componentes esféricas como segue. Usando 

(Bo =1;  (Bi=-1//2, (Ba =1//3 

($) =-i/V2, 0 (9a =-i/v2, 


mama 
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a Equação (4.110) para m = O se torna 


GALA OSa = (8) (51) = N((8)o) =N 
=z] al 3) al | =» 


em que usamos C(111[101) = 5 da Equação (4.103) em lugar de Jı = 1 = J2, o que implica C(111|1, —1, 0) = 


Z usando as Equações (4.104a,b): 


E l c(1111101) 1 Atak L eau 1,0) 
10-1] 73 CO Sesi a Ai 


Um pouco mais simples é o produto escalar usual de dois vetores no Capítulo 1, no qual a e b são acoplados a 
momento angular zero: 


a - b = —(ab)o v3 = -v3 X` C(10m, -m,0)amb-m (4.111) 
Mais uma vez, a ordem zero de nosso produto de tensores implica a -b = n(ab)o. A constante n pode ser 
determinada por um caso especial, em essência escrevendo 22 = 1 em componentes esféricas: 2? = 1 = 


nC(110/000) = A 

Uma outra aplicação de tensores usada com freqüência é o reacoplamento que envolve símbolos 6j para três 
operadores e 9j para quatro operadores.!? Um exemplo é o produto escalar seguinte, para o qual se pode demonstrar 
que 


1 
Oj'rO2*r=— gro1 02 + (0102): (rr)o, (4.112) 


mas que também pode ser rearranjado por meios elementares. Aqui, os operadores tensoriais são definidos como 


(0102)m = >, C(L2mimam)o im, 2m2; (4.113) 


mama 


8 
(rr)2m = XC COL mamam rama = 4/ 157 Yom (Ê), (4.114) 
e o produto escalar de tensores de ordem 2 como 


(0105)»2 E (rr)2 = 3-1” (or02)am(rr)o,-m = v5((oro2)2(rr)>) g: (4.115) 


m 


Uma das aplicações mais importantes de operadores tensoriais esféricos é o teorema de Wigner-Eckart. Esse 
teorema diz que um elemento matricial de um operador em tensor esférico Tgm de ordem k entre estados de 
momento angular j e j’ se fatora um coeficiente de Clebsch-Gordan e um denominado elemento de matriz 
reduzida, denotado por barras duplas, que não tem mais dependência alguma dos números quânticos de projeção 
m, m,n: , 

(j'm'|Tenljm) = C(kjj nam A GT / VCF + D. (4.116) 
Em outras palavras, tais elementos matriciais se fatoram em uma parte dinâmica, o elemento de matriz reduzida, 
e em uma parte geométrica, o coeficiente de Clebsch-Gordan que contém as propriedades rotacionais (expressas 
pelos números quânticos de projeção) da invariância SO(3). Para ver isso, acoplamos Tkn com o estado inicial ao 
momento angular total j’: 
| m'o = XÙ C(kjj'nmm')Tkn|jm). (4.117) 
nm 
Sob rotações, o estado |j'm')o se transforma exatamente como |j/m'). Assim, o elemento da matriz de 
sobreposição (9'm'|)'m')q é um escalar rotacional que não tem dependência alguma de m’, de modo que podemos 
tomar a média das projeções, 


E ÔJ 1Ô Mm! E 5 
Mimo = 2 ui ndo. (4.118) 
H 
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Em seguida, substituímos nossa definição, Equação (4.117), na Equação (4.118) e invertemos a relação, 
Equação (4.117), usando ortogonalidade, Equação (4.99b), para constatar que 


š LS PA Ojj Mm ôMm' 
(JMI|Tenlim) = Ch 2 JuļJ uo, (4.119) 
o que prova o teorema de Wigner-Eckart, Equação (4.116).! 

Como aplicação, podemos escrever os elementos das matrizes de Pauli em termos dos coeficientes de Clebsch- 
Gordan. Aplicamos o teorema de Wigner-Eckart a 


(anloa|28) = Ca) = — 50 (155087) llela) (4.120) 
Visto que (1 3|co|55) = 1 com oo = o3 e C(151|011)=—1/v3, encontramos 
(allollz) = vô, (4.121) 
que, substituído na Equação (4.120), resulta em 
(Ca)ys = —V 30 (133/0877). (4.122) 
Note que o a = 1, 0 denota as componentes esféricas das matrizes de Pauli. 


Tableaux de Young para SU(n) 

Os Tableaux de Young (TY) fornecem um método poderoso e elegante para decompor produtos de representações 
de grupo SU(n) em somas de representações irredutíveis. Os TY dão as dimensões e os tipos de simetria das 
representações irredutíveis nessa denominada série de Clebsch-Gordan, embora não dêem os coeficientes de 
Clebsch-Gordan pelos quais os estados de produto são acoplados aos números quânticos de cada representação 
irredutível das séries (veja a Equação (4.94)). 

Produtos de representações correspondem a estados de multipartículas. Neste contexto, permutações de 
partículas são importantes quando tratamos com diversas partículas idênticas. Permutações de n objetos idênticos 
formam o grupo simétrico S„. Uma conexão próxima entre representações irredutíveis de Sn, que são os TY, e as 
dos SU(n), é dada por este teorema: todo estado de N partícula de S,, que é composto de estados de uma única 
partícula do multipleto fundamental n dimensional SU(n) pertence a uma representação irredutível SU(n). Uma 
prova está no Capítulo 22 de Wybourne!*, 

Para SU(2) a representação fundamental é uma caixa que representa os estados de spin +4 (para cima) e -4 
(para baixo) e tem dimensão 2. Para SU(3) a caixa compreende os três estados de quark no triângulo da Figura 4.5a; 
tem dimensão 3. 

Um arranjo de caixas mostrado na Figura 4.8 com A; caixas na primeira linha, À» caixas na segunda linha, ..., 
e An-1 caixas na última linha é denominado tableau de Young (TY), denotado por [A1,..., An-1], e representa 
uma representação irredutível de SU(n) se, e somente se, 


A 2 A2 2: > An. (4.123) 


Caixas na mesma linha são representações simétricas; as que estão na mesma coluna são anti-simétricas. Um TY 
de apenas uma linha é totalmente simétrico. Um TY de uma única coluna é totalmente anti-simétrico. 

Há no máximo n — 1 linhas para o TY de SU(n) porque uma coluna de n caixas é a representação totalmente 
anti-simétrica do singleto (determinante de Slater de estados de uma partícula única) que pode ser eliminado de 
TY. 

Um arranjo de N caixas é um estado de N partículas cujas caixas podem ser rotuladas por inteiros positivos, 
de modo que os números (ou rótulos de partículas) em uma linha do TY não diminuem da esquerda para a direita 
e os de qualquer uma coluna aumentam de cima para baixo. Ao contrário das possíveis repetições de números de 
linhas, os números em qualquer coluna devem ser diferentes por causa da anti-simetria desses estados. 

O produto de um TY com uma única caixa [1] é a soma do TY formado quando a caixa é colocada no final de 
cada linha do TY, contanto que o TY resultante seja legítimo, isto é, obedeça à Equação (4.123). Para SU(2), o 
produto de duas caixas, representações de spin 1/2 de dimensão 2, gera 


[1] 8 [1] = [2] @ [1,1], (4.124) 


BO fator extra (— 1) 3 +" //(29' + 1) na Equação (4.116) é apenas uma convenção que varia na literatura. 
14B.G. Wybourne Classical Groups for Physicists. Nova York: Wiley (1974). 
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Figura 4.8: Tableau de Young (TY) para SU(n). 


3 4 N=234=24 1 


(a) (b) 3 


Figura 4.9: Ilustração de (a) N e (b) D na Equação (4.125) para o octeto de SU(3) no tableau de Young. 


a representação simétrica de spin 1 de dimensão 3 e o singleto anti-simétrico de dimensão 1 mencionado antes. 

A coluna de n — 1 caixas é a representação conjugada da representação fundamental; seu produto com uma 
única caixa contém a coluna de n caixas, que é o singleto. Para SU(3), a representação conjugada da caixa única 
[1] ou representação fundamental de quark é o triângulo invertido na Figura 4.5b, [1,1], que representa os três 
antiquarks ŭ, d, 5, obviamente também de dimensão 3. 

A dimensão de um TY é dada pela razão 

; N 

dim TY = D (4.125) 
O numerador N é obtido escrevendo um n em todas as caixas do TY ao longo da diagonal (n + 1) em todas 
as caixas imediatamente acima da diagonal (n — 1), imediatamente abaixo da diagonal etc. N é o produto de 
todos os números no TY. A Figura 4.9a mostra um exemplo para a representação em octeto de SU(3), em que 
N = 2-3.4 = 24, Há uma fórmula fechada que é equivalente à Equação (4.125).!º O denominador D é o produto 
de todos os ganchos.!º Desenhamos um gancho através de cada caixa do TY começando por uma linha horizontal 
que parte da direita da caixa em questão e então continua na vertical fora do TY. O número de caixas atravessadas 
pela linha do gancho é o número de gancho da caixa. D é o produto de todos os números de gancho do TY. A 
Figura 4.9b mostra um exemplo de octeto de SU(3), cujo número de gancho é D = 1.3.1 = 3. Por conseguinte, 
a dimensão do octeto de SU(3) é 24/3 = 8, daí seu nome. 

Agora podemos calcular as dimensões do TY na Equação (4.124). Para SU(2), elas são 2 x 2 = 3+ 1 = 4. Para 
SU(3), são 3 -3 = 3 - 4/(1 -2) +3 -2/(2- 1) = 6 + 3 = 9. Para o produto do TY de SU(3) quark vezes antiquark 
obtemos 


[1,1] $ [1] = [2,1] & [1,1,1], (4.126) 


isto é, octeto e singleto, que são precisamente os multipletos de mésons considerados na subseção sobre o caminho 
óctuplo, a simetria de sabor SU(3) que sugere que mésons são estados ligados de um quark e um antiquark, 


!5Veja, por exemplo, M. Hamermesh, Group Theory and Its Application to Physical Problems. Reading, MA: Addison-Wesley (1962). 
16F, Close, Introduction to Quarks and Partons. Nova York: Academic Press (1979). 
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configurações qq. Para o produto de três quarks obtemos 
(1) o [1)) e 1) = (12 e [1,1]) $ 1) = [3] @ 2{2, 1] @ [1,1,1], (4.127) 


isto é, decupleto, octeto e singleto, que são os multipletos observados para os bárions, que sugerem que eles são 
estados ligados de três quarks, configurações qqq. 

Como vimos, TY descreve a decomposição de um produto de representações irredutíveis de SU(n) em 
representações irredutíveis de SU(n), que é denominada série de Clebsch-Gordan, enquanto os coeficientes de 
Clebsch-Gordan considerados antes permitem a construção dos estados individuais nessa série. 


Exercícios 
4.4.1 Derive relações de recorrência para coeficientes de Clebsch-Gordan. Use-as para calcular 
C(11J|mimzM) para J = 0,1, 2. 
Sugestão: Use os elementos de matriz conhecidos de J} = Ju + Joy, Jip, € J? = (J1 + J2)? etc. 
4.4.2 Mostre que (Yx)y = X C(l4J|mm.M)Yim Xm,» €m que X+1/2 São as autofunções de spin 
para cima e para baixo de o3 = co», se transformam como um tensor esférico de ordem J. 


4.4.3 Quando o spin de quarks é levado em conta, a simetria de sabor SU(3) é substituída pela simetria 
SU(6) Por quê? Obtenha o tableau de Young para a configuração de antiquark q. Então decomponha 
o produto qq. Quais representações de SU(3) estão contidas na representação não trivial de SU(6) 
para mésons? 
Sugestão: Determine as dimensões de todos os TY. 


4.4.4 Para | = 1, a Equação (4.107a) se torna 


1 
Yr, g) = >, Dale B, VYE (0, p). 


m'=—1 


Reescreva esses harmônicos esféricos em forma cartesiana. Mostre que as equações de coordenadas 
cartesianas resultantes são equivalentes à matriz de rotação de Euler A(«, 3,7), Equação (3.94), 
rotacionando as coordenadas. 


4.4.5 Admitindo que D’ (a, B, y) é unitário, mostre que 


l 
NO YP (01, p1 )Yi (02, p2) 


m=-—I 


é uma quantidade escalar (invariante sob rotações ). Esse é um tensor esférico análogo a um produto 
escalar de vetores. 


4.4.6 (a) Mostre que a dependência a e y de DI (a, (3,7) pode ser eliminada por fatoração, de modo que 


D’ (œ, 8,7) = A’ (a)d (6) (9). 


(b) Mostre que A? (a) e CI (y) são diagonais. Ache as formas explícitas. 
(c) Mostre que d? (8) = DI (0, 8, 0). 


4.4.7 A forma de m exponencial de momento angular dos operadores de rotação do ângulo de Euler é 


R = Rer (7)Ry (8)Rz (a) 
= exp(—iyJz") exp(—iBJ, ) exp(—iaJz). 


Mostre que em termos dos eixos originais 
R = exp(iaJ.) exp(—iß Jy) exp(—iyJz). 


Sugestão: Os operadores R se transformam como matrizes. A rotação ao redor do eixo y’ (segunda 
rotação de Euler) pode ser referida ao eixo y original por 


exp(—i8J,) = exp(—iaJ. )exp(—i5J,) exp(iaJ.). 
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4.4.8 Usando o teorema de Wigner-Eckart, prove o teorema da decomposição para um operador de vetor 
Gm|T-Tilim) s 

CGA Our 

4.4.9 Usando o teorema de Wigner-Eckart, prove a 


esférico (j'm'|Tim| jm) = 


GmJus Talim) = (jm |Jmljm) sy m]I Talimy. 


4.5 Grupo Homogêneo de Lorentz 

Generalizando a abordagem de vetores da Seção 1.2, em relatividade especial exigimos que nossas leis da física 
sejam covariantes!” sob 

a. translações do espaço e do tempo, 

b. rotações no espaço real, tridimensional e 

c. transformações de Lorentz. 


A exigência de covariância sob translações é baseada na homogeneidade do espaço e do tempo. Covariância sob 
rotações é uma asserção da isotropia de espaço. O requisito de covariância de Lorentz vem da relatividade especial. 
Todas essas três transformações juntas formam o grupo não-homogêneo de Lorentz ou o grupo de Poincaré. 
Quando excluídas as translações, as rotações no espaço e a transformação de Lorentz juntas formam um grupo 
— o grupo homogêneo de Lorentz. 

Em primeiro lugar, geramos um subgrupo, as transformações de Lorentz nas quais a velocidade relativa v 
está ao longo do eixo x = xt. O gerador pode ser determinado considerando sistemas de referência espaço- 
temporais movimentando-se com uma velocidade relativa dv, um infinitésimo.!$ As relações são similares àquelas 
para rotações no espaço real, Seções 1.2, 2.6 e 3.3, exceto que, aqui, o ângulo de rotação é imaginário puro 
(compare com a Seção 4.6). 

Transformações de Lorentz são lineares não somente nas coordenadas espaciais x; mas também no tempo t. 
Elas se originam das equações de Maxwell da eletrodinâmica, que são invariantes sob transformações de Lorentz, 
como veremos mais adiante. Transformações de Lorentz deixam a forma quadrática c2t? — x? — r? — z? = 
xå — 27 — x2 — x3 invariante, em que xo = ct. Vemos isso se acendermos uma fonte de luz na origem do sistema 
de coordenadas. No tempo t, a luz viajou a distância ct = 4/5 «2, portanto c2t? — x? — x3 — x? = (0. A 
relatividade especial requer que em todos os sistemas (inerciais) que se movimentam com velocidade v < c em 


ualquer direção relativa ao sistema zx; e têm a mesma origem no tempo t = 0, ct! ? — x1? — x1? — x42 = 0 também 
1 2 3 


seja válida. Um espaço-tempo quadridimensional com a métrica x : x = x? = x — x? — x} — x3 é denominado 
espaço de Minkowski, com o produto escalar de dois quadrivetores definido como a - b = aobo — a - b. Usando o 


tensor métrico, 


1 0 0 0 
(guu) = (g9) = ET dE el (4.128) 
Jw) = (g E E ; 


0 0 0 -i 


podemos elevar e abaixar os índices de um quadrivetor, tal como as coordenadas z” = (x0,x), de modo que 
Lu = Gui” = (xo, —x) e LP gua” = o — x°, ficando subentendida a convenção da soma de Einstein. Para o 
gradiente, O! = (0/0x0,—V) = 09/0x, e O, = (9/0x0, V), portanto, 92 = 99, = (0/0709)? — V? é um 
escalar de Lorentz, exatamente como a métrica x? = ag — x?. 

Para v < c, no limite não-relativista, uma transformação de Lorentz deve ser galileana. Por conseguinte, para 
derivar a forma de uma transformação de Lorentz ao longo do eixo zı, começamos com uma transformação 


galileana para a velocidade relativa infinitesimal dv: 
x'! = r! — ĝvt = r! — 06. (4.129) 
Aqui, 8 = v/c. Por simetria, escrevemos também 
x’? = x° + aófa!, (4.129) 
escolhendo o parâmetro a, de modo que x8 — x? seja invariante, 


co —-2 = 2) — 24. (4.130) 


Ser covariante significa ter a mesma forma em sistemas coordenados diferentes, de modo que não há um sistema de referência preferido 
(compare com as Seções 1.2 e 2.6). 
!8Essa derivação, com uma métrica ligeiramente diferente, aparece em um artigo de J. L. Strecker, Am. J. Phys. 35: 12 (1967). 


“livro” — 2007/8/1 — 15:06 — page 212 — #222 


212 Física Matemática Arfken e Weber ELSEVIER 


Lembre-se de que z” = (x?,x) é o vetor protótipo quadridimensional no espaço de Minkowski. Assim, 


a Equação (4.130) é uma simples declaração da invariância do quadrado da grandeza do vetor “distância” 
sob transformação de Lorentz no espaço de Minkowski. É aqui que a relatividade especial entra em nossa 
transformação. Elevando ao quadrado e subtraindo as Equações (4.129) e (4.129) e descartando os termos de 
ordem (5/5)2, encontramos a = —1. As Equações (4.129) e (4.129”) podem ser combinadas como uma equação 


matricial 
x x? 
n |=(12-6801)| a]; (4.131) 
r £ 


por acaso, cı é a matriz de Pauli, c1, e o parâmetro ôĝ8 representa uma alteração infinitesimal. Usando as mesmas 
técnicas da Seção 4.2, repetimos a transformação N vezes para desenvolver uma transformação finita com o 
parâmetro de velocidade p = Nó. Então, 


10 N 0 
( n ) = (1. = ea É l (4.132) 


No limite, à medida que N > œ, 


N 
; o 
qua (1 - a) = exp(-po1). (4.133) 


Assim como na Seção 4.2, a exponencial é interpretada por uma expansão de Maclaurin, 


1 1 
exp(—po1) = l2 — poi + (po) a (poa) parey (4.134) 
Notando que (01)? = 19, 
exp(—po1) = 1o cosh p — oq sinh p. (4.135) 


Por conseqiiência, nossa transformação finita de Lorentz é 


x’? coshọ —senh p x? 
= . (4.136) 
g'1 —senh p cosh p x! 


gı gerou as representações dessa transformação de Lorentz pura. As quantidades cosh p e senhp podem ser 
identificadas considerando a origem do sistema de coordenadas “com linha”, z’! = 0 ou x! = vt. Substituindo na 
Equação (4.136), temos 


0 = x! cosh p — z°senh p. (4.137) 
Com z! = vt and x° = ct, 
v 


Note a rapidez p 4 v/c, exceto no limite com que v — 0. A rapidez é o parâmetro aditivo para a transformação 
de Lorentz puras (“boosts”) ao longo do mesmo eixo que corresponde a ângulos para rotações ao redor do mesmo 
eixo. Usando 1 — tgh2p = (cosh? p)~t, 


cosh p = (1 — PT =y, senh p = 87. (4.138) 


O grupo de transformações de Lorentz não é compacto, porque o limite de uma seqüência de rapidez que tende ao 
infinito não é mais um elemento do grupo. 

O caso especial precedente da velocidade paralela a um eixo do espaço é fácil, mas ilustra a técnica por 
exponenciação dos geradores das transformações infinitesimais de velocidade. Agora, esta técnica exata pode ser 
aplicada para derivar a transformação de Lorentz para a velocidade relativa v não-paralela a qualquer eixo do 
espaço. As matrizes dadas pela Equação (4.136) para o caso de v = Xv, formam um subgrupo. As matrizes no 
caso geral, não. O produto de duas matrizes de transformação de Lorentz L(v1) e L(v2) resulta em uma terceira 
matriz de Lorentz, L(vs), se as duas velocidades vı e v2 forem paralelas. A velocidade resultante, v3, é relacionada 
com v; e va pela lei da adição de velocidade de Einstein, Exercício 4.5.3. Se vı e va não forem paralelas, essa 
relação simples não existe. Especificamente, considere três referenciais S, 9” e S”, com S e S” relacionados por 
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L(v1) e S” e S” relacionados por L(v2). Se a velocidade de S” relativa ao sistema original S é vs, S” não é obtida 
de S por L(vs) = L(v>)L(vi). Em vez disso, constatamos que 


L(v3) = RL(v2)L(v1), (4.139) 


em que R é uma matriz 3 x 3 de rotação no espaço inserida em nosso espaço-tempo quadridimensional. Com vı 
e v2 não-paralelas, o sistema final, S”, é rotacionado em relação a S. Essa rotação é a origem da precessão de 
Thomas envolvida em termos de acoplamento spin-órbita em física atômica e nuclear. Por causa de sua presença, 
as transformações de Lorentz puras L(v) por si sós não formam um grupo. 


Cinemática e Dinâmica em Espaço-Tempo de Minkowski 
Vimos que a propagação da luz determina a métrica 


r e= 0r? et? 


em que z” = (ct,r) é o quadrivetor de coordenadas. Para uma partícula que se movimenta com velocidade v, a 
versão infinitesimal invariante de Lorentz 


cdr = y dz! dz, = y Ê dt? — dr? = dive — v? 


define o tempo próprio invariante 7 em sua trajetória. Por causa da dilação do tempo em referenciais em 
movimento, um relógio de tempo real acompanha a partícula (no seu referencial de repouso) e funciona à menor 
taxa possível em comparação com a de qualquer outro referencial inercial (um observador, por exemplo). A 
quadrivelocidade da partícula agora pode ser adequadamente definida como 


dat j c v 
—— DU pe? 
dr VE- v? Ve —v2 q 


portanto, u? = 1, e o quadrimomento p” = cmu” = (£, p) resulta na famosa relação de energia de Einstein 


2 
me 2 


E É Somar Y EE 


INDO 2 
22 


Uma conseqgiiência de u? = 1 e seu significado físico é que a partícula está sobre sua camada de massa p? = m2c?. 
Agora formulamos a equação de Newton para uma partícula única de massa m em relatividade especial como 


H . . = . . 
de = K”, sendo que K” denota o quadrivetor força, portanto sua parte vetorial da equação coincide com a forma 


usual. Para u = 1,2,3 usamos dr = dt,/1 — v2/c? e encontramos 


1 dp F -K 
vi-vjêd Ji- vje 


que determina K em termos da força usual F. Precisamos achar Kº. Prosseguimos por analogia com a derivação 
de conservação de energia, multiplicando a equação de força na quadrivelocidade 


porque u? = 1 = constante. O outro lado da equação de Newton resulta em 
1 K? F- v/c 


u: K = , 
c V1 — v2/c2 Iv 
F.v/c 


portanto, Kº — VE é relacionada à taxa de trabalho realizado pela força sobre a partícula. 
—V c 


Agora abordamos colisões de dois corpos, nas quais a conservação de energia-momento toma a forma pı +p2 = 
P3 + pa, em que p! são os quadrimomentos das partículas. Como o produto escalar de qualquer quadrivetor por 
ele próprio é invariante sob transformações de Lorentz, é conveniente definir a energia invariante de Lorentz ao 
quadrado, s = (pı + po)? = P? em que P” é o quadrimomento total, e usar unidades em que a velocidade da 
luz c = 1. O sistema de laboratório (lab) é definido como a estrutura de repouso da partícula com quadrimomento 
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p$% = (mz, 0) e referencial do centro de momento (cms) é definido pelo quadrimomento total P” = (E1 + E5,0). 
Quando a energia incidente de lavoratório EL é dada, então 


2 2 2 2 L 
s = pi + p3 + 2pı p2 = Mi + m3 + 2m2E1 
é determinada. Agora, as energias cms das quatro partículas são obtidas de produtos escalares 


pı: P = E (E + E2) = Es, 


portanto, 
E= pı: (pı + p2) Es mi TP pa mî -m3 TS 
Vs Vs 2/5 | 
p, P (Pi +p) _ mi+p:p micmits 
V's Vs 2/5 
E, = P (p3 + pa) — mã + ps: pa =” mã-mi+s 
3 vs vs 2/8 
E, = Pa (Po + pa) = mi +p: pa mi- m+s 
Vs Vs 2/8 
por substituição de 
2p1 p=s-mij-má, 2ps pa = $ — M3 — má. 


Assim, todas as energias cms E; dependem somente da energia incidente, mas não do ângulo de dispersão. Para 
espalhamento elástico, mg = M1, M4 = ma, portanto Es = E1, E4 = E». A transferência de momento invariante 
de Lorentz ao quadrado 
2 2 2 
t = (pı — ps)” = mi + m3 — 2pı : ps 


depende linearmente do co-seno do ângulo de espalhamento. 


Exemplo 4.5.1 DECAIMENTO DO KÁON E LIMIAR DE FOTOPRODUÇÃO DE PÍON 
Ache as energias cinéticas do múon de massa 106 MeV e neutrino sem massa no qual um méson K de massa 
494 MeV decai em seu referencial de repouso. 

A conservação de energia e momento dá mg = E, + E, = vys. A aplicação da cinemática relativista descrita 
anteriormente resulta em 


2 
E — Pu: (pu + py) — Mi + Pu’ Pv 
z MK MK É 
E — Pe (Pu tp)  PuPv 
E = . 
mg mg 


Combinando ambos os resultados, obtemos mi = m? + 2P, : Pv, portanto 


mk +m 
Ee EN S ae RMN 
m2 — m? 
E, =T,=-É + = 235,6 MeV. 
2mkK 


Como outro exemplo, na produção de um píon neutro por um fóton incidente de acordo com y + p — 7º + p' no 
limiar, o píon neutro e o próton são criados em repouso no cms. Por conseguinte, 


Si (py +p) = mo + 2mp BY = (Pr +p) = (ma + mp)’, 


portanto, E? = my + m3 — 144.7 MeV. 


2Mp 
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Exercícios 


4.5.1 Duas transformações de Lorentz são executadas em sucessão: vı ao longo do eixo x e em seguida 
va ao longo do eixo y. Mostre que a transformação resultante (dada pelo produto dessas duas 
transformações sucessivas) não pode ser colocada na forma de uma única transformação de 
Lorentz. 

Nota: A discrepância corresponde a uma rotação. 


4.5.2 Derive novamente a transformação de Lorentz, trabalhando inteiramente no espaço real 
(x°, £t, £?, £3) com z? = zo = ct. Mostre que a transformação de Lorentz pode ser escrita como 
L(v) = exp(po), sendo 
0 —àÀ -u —v 
=A 0 0 0 
—u 0 0 0 


—v 0 0 0 


e À, u, v são os co-senos diretores da velocidade v. 


4.5.3 Usando a relação matricial, Equação (4.136), seja a rapidez p, relacionada aos referenciais de 
Lorentz (x'º,x'!) e (1º,x!). Seja p, relacionada a (x”?°,g”!1) e (x'?,x'1). Por fim, seja p 
relacionada a (12,11) e (1º ,x!). Por p = pı + po derive a lei da adição de velocidade de 
Einstein 

= vi + Va 
a + vivo / c? 


4.6 Covariância de Lorentz de Equações de Maxwell 


Se uma lei física deve ser válida para todas as orientações de nossas coordenadas (reais) — isto é, deve ser 
invariante sob rotações —, os termos da equação devem ser covariantes sob rotações (Seções 1.2 e 2.6). Isso quer 
dizer que escrevemos as leis da física na forma matemática escalar = escalar, vetor = vetor, tensor de segunda 
ordem = tensor de segunda ordem, e assim por diante. De modo semelhante, se uma lei da física deve ser válida 
para todos os sistemas inerciais, os termos da equação devem ser covariantes sob transformações de Lorentz. 

Usando o espaço de Minkowski (ct = x?; x = xt, y = 12, z = x3), temos um espaço quadridimensional com a 
métrica guv (Equação (4.128), Seção 4.5). As transformações de Lorentz são lineares no espaço e no tempo nesse 
espaço real quadridimensional.!? 


Aqui, consideramos equações de Maxwell, 


VxE= E (4.140a) 
VxH= = + pv, (4.140b) 
V.D=», (4.140c) 
V.B=0, (4.140d) 
e as relações 
D=cE, B = uH. (4.141) 


Os símbolos têm seus significados usuais como dados na Seção 1.9. Por simplicidade, admitimos o vácuo (€ = £ọ, 
H= Ho). 

Admitimos que as equações de Maxwell são válidas em todos os sistemas inerciais; isto é, as equações de 
Maxwell são consistentes com a relatividade especial. (Na verdade, a covariância das equações de Maxwell 
sob transformações de Lorentz foi demonstrada por Lorentz e Poincaré antes de Einstein propor sua teoria da 
relatividade especial. Nosso objetivo imediato é reescrever as equações de Maxwell como equações de tensores 
em um espaço de Minkowski. Isso fará com que a covariância de Lorentz fique explícita ou evidente. 


Uma derivação teórica de grupo da transformação de Lorentz em espaço de Minkowski aparece na Seção 4.5. Veja também H. Goldstein, 
Classical Mechanics. Cambridge, MA: Addison-Wesley (1951), Capítulo 6. A equação métrica vê — x? = 0, independente do referencial, 
leva às transformações de Lorentz. 
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Em termos de um escalar, p, e potenciais vetores magnéticos, A, podemos resolver?” a Equação (4.140d) e 
então (4.140a) por 


SALA io (4.142) 


A Equação (4.142) especifica o rotacional de A; a divergência de A ainda é indefinida (compare com a Seção 
1.16). Podemos, e assim o faremos para conveniência futura, impor mais uma restrição de calibre ao potencial 
vetorial A: 


VA + con =0. (4.143) 


Esta é a relação calibre de Lorentz. Ela servirá para desacoplar as equações diferenciais para A e y que virão em 
seguida. Os potenciais A e y ainda não são completamente fixos. A liberdade restante é o tópico do Exercício 
4.6.4. 

Agora reescrevemos as equações de Maxwell em termos dos potenciais A e y. Pelas Equações (4.140c) para 
V.D, (4.141) e (4.142), 


Víot+V.— = (4.144) 
enquanto as Equações (4.140b) para V x H e (4.142) e Equação (1.86c) do Capítulo 1 resultam em 


2 A op 1 2 pv 
vV VV.A-VÍAL= — 4.145 
ot? Ei ot ji a. } E0 ( ) 


Usando a relação de Lorentz, Equação (4.143), e a relação copy = 1/c2, obtemos 


» 102 
O = HoPV, 
2 18 P 
[7 Zp g= F (4.146) 


Agora, o operador diferencial (veja também o Exercício 2.7.3) 


2 18 __ 2_ 
SD E -dO) 


é um laplaciano quadridimensional, usualmente denominado d"alembertiano e às vezes também denotado por 
E um escalar por construção (veja o Exercício 2.7.3). 
Por conveniência, definimos 


As Az 
A! = —& = cegAs, A? = E = ceo Az, 

Roe Hoc (4.147) 
A&A = = ceo Ay; Ao = eop = 4º. 

Hoc 


Se, além disso, definirmos uma densidade de corrente quadrivetorial 
E Ejh EE LAA p= jo = J}, (4.148) 
então a Equação (4.146) pode ser escrita na forma 
At = j”. (4.149) 
A equação de onda (4.149) é parecida com uma equação quadrivetorial, mas parece não constituir prova. 


Para provar que ela é uma equação quadrivetorial, começamos investigando as propriedades de transformação 
da corrente generalizada j”. 


20Compare com a Seção 1.13, em especial com o Exercício 1.13.10. 
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Uma vez que um elemento de carga elétrica de é uma quantidade invariante, temos 
de = pdx! dx? dz?, invariante. (4.150) 


Vimos na Seção 2.9 que o elemento de volume quadridimensional dx? dx! dx? dx? também era invariante, um 
pseudo-escalar. Comparando este resultado, Equação (2.106), com a Equação (4.150), vemos que a densidade de 
carga p deve se transformar do mesmo modo que dz”, a componente de ordem zero de um vetor quadridimensional 
dx”, Igualamos p = jº, sendo que, agora, j° está estabelecida como a componente de ordem zero de um 
quadrivetor. As outras partes da Equação (4.148) podem ser expandidas como 


1 PV p dx! O da! 

i c cat! dao 
Uma vez que acabamos de mostrar que j° se transforma como dzº, isso significa que j! se transforma como 
dx!. Com resultados similares para j? e j’, temos jò se transformando como dzx?, provando que jò é um vetor 
quadridimensional no espaço de Minkowski. 

Admitimos que a Equação (4.149), que resulta diretamente das equações de Maxwell, Equações (4.140), é 
válida em todos os sistemas cartesianos (todos os referenciais de Lorentz). Então, pela regra do quociente, Seção 
2.8, A” também é um vetor e a Equação (4.149) é uma equação tensorial legítima. 

Agora, trabalhando para trás, a Equação (4.142) pode ser escrita 


(4.151) 


04) ðA 
E&E; = -= — =, j = 1,2,3, 
7 ôx? Əxi 
k j (4.152) 
i B a a (i, j, k) = permutação cíclica(1, 2, 3) 
p= z , t, J, = 14) * 
Hoc ðxİ dar 
Definimos um novo tensor, 
OA DA! 
DAM OA = — o E PO=-PMO (1,A=0,1,2,3), 
H A 


0 Ep Ep E 0 E, -E, -—E, 

Fx — Ez (0) —cB, cBy Frà Ez 0 —cB;, cBy 

E0 -E, cB, 0 =cB, |” Eq E, cB; 0  —cB, 
=E; —cBy €Bz 0 E, -—cB, Bz 0 


(4.153) 


Note que em nosso espaço quadridimensional de Minkowski E e B não são mais vetores, mas juntos formam 
um tensor de segunda ordem. Com esse tensor podemos escrever as duas equações não-homogêneas de Maxwell 
((4.140b) e (4.140c)) combinadas como uma equação tensorial, 
Fu 
OT 


E (4.154) 


O lado esquerdo da Equação (4.154) é uma divergência quadridimensional de um tensor e, portanto, um vetor. Isso, 
é claro, é equivalente a contrair um tensor de terceira ordem parcial 952" /9x, (compare com os Exercícios 2.7.1 
e 2.7.2). As duas equações homogêneas de Maxwell — (4.140a) para V x E e (4.140d) para V - B — podem ser 


expressas sob a forma de tensor 


=0 4.155 
xı Ox, T3 ( ) 
para a Equação (4.140d) e três equações da forma 
oF. oF, oF: 
30 o2 923 q (4.156) 


x2 xs xo 
para a Equação (4.140a). (Uma segunda equação permuta 120, uma terceira permuta 130.). Visto que 


opor 


Ane 
TOP 


o dé = 
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é um tensor (de terceira ordem), as Equações (4.140a) e (4.140d) são dadas pela equação tensorial 
EL E a 1 queA = 0, (4.157) 


Pelas Equações (4.155) e (4.156) você entenderá que se supõe que os índices À, u e v são diferentes. Na verdade, a 
Equação (4.157) se reduz automaticamente a O = 0 se quaisquer dois índices coincidirem. Uma forma alternativa 
da Equação (4.157) aparece no Exercício 4.6.14. 


Transformação de Lorentz de E e B 
A construção das Equações tensoriais (4.154) e (4.157) conclui nosso objetivo inicial de reescrever as equações 
de Maxwell sob forma tensorial.?! Agora exploraremos as propriedades de tensores de nossos quatro vetores e do 
tensor Fy. 

Para a transformação de Lorentz correspondente ao movimento ao longo do eixo z(x3) com velocidade v, os 
“co-senos diretores” são dados por? 


x’ = q(x? S Bz?) 
4.1 
x’? = y(x? — 84º), ( 58) 
em que 
v 
Pa 
e 
y= (1-6. (4.159) 


Usando as propriedades de transformação tensorial, podemos calcular os campos elétrico e magnético no sistema 
em movimento em termos dos valores no referencial original. Pelas Equações (2.66), (4.153) e (4.158) obtemos 


1 v 
ARES 
Rr: (2 z8); 


E! = AF (z, + ZB); (4.160) 
El = E, 

e 
dor E p (2: ë 1) 
Bi = = (5; SE), (4.161) 
B! = B, 


Esse acoplamento de E e B é de se esperar. Considere, por exemplo, o caso de campo elétrico zero no sistema 
“sem linha” 
E, = E = E; =0. 


Está claro que não haverá nenhuma força sobre uma partícula carregada estacionária. Quando a partícula está em 
movimento com uma pequena velocidade v ao longo do eixo z,” um observador na partícula vê campos (que 
exercem uma força sobre sua partícula carregada) dados por 


E, =-vB 
E, = vBs,, 


y> 


em que B é um campo de indução magnética no sistema “sem linha”. Essas equações podem ser postas em forma 
vetorial 
E'=vxB (4.162) 


21 Teorias modernas de eletrodinâmica quântica e das partículas elementares costumam ser escritas nessa forma “evidentemente covariante” 
para garantir consistência com a relatividade especial. Ao contrário, a insistência em tal forma tensorial tem sido um útil guia na construção 
dessas teorias. 

22Uma derivação teórica de grupo da transformação de Lorentz aparece na Seção 4.5. Veja também Goldstein, loc. cit., Capítulo 6. 

23 Se a velocidade não for pequena, é preciso uma transformação relativista da força. 


“livro” — 2007/81 — 15:06 — page 219 — #229 


ELSEVIER 4. TEORIA DOS GRUPOS 219 


ou 
F = qv x B, 


que costuma ser considerada a definição operacional da indução magnética B. 


Invariantes Eletromagnéticas 

Por fim, as propriedades do tensor (ou vetor) nos permitem construir um grande número de quantidades invariantes. 
Uma delas, muito importante, é o produto escalar dos dois vetores quadridimensionais ou quadrivetores 4, e j). 
Temos 


A` jx = —cegÃs — ceoAy y CE0 A; s +copp 
= colp — A - J), invariante, (4.163) 


sendo A o potencial vetor magnético usual e J a densidade de corrente ordinária. O primeiro termo, pọ, é o 
acoplamento elétrico estático ordinário, com dimensões de energia por unidade de volume. Daí nosso invariante 
escalar recém-construído ser uma densidade de energia. A interação dinâmica de campo e corrente é dada pelo 
produto A - J. Esse invariante ^j, aparece nas lagrangianas eletromagnéticos dos Exercícios 17.3.6 e 17.5.1. 

Outros possíveis invariantes eletromagnéticos aparecem nos Exercícios 4.6.9 e 4.6.11. 

O grupo de Lorentz é o grupo de simetria da eletrodinâmica, da teoria de calibre eletrofraco e das interações 
fortes descritas pela cromodinâmica Lorentz quântica: ele governa a relatividade especial. A métrica do espaço- 
tempo de Minkowski é a invariante de Lorentz, e expressa a propagação da luz; isto é, a velocidade da luz é a 
mesma em todas as estruturas inerciais. As equações de movimento de Newton podem ser estendidas diretamente 
para a relatividade especial. As cinemáticas, nas colisões de dois corpos são importantes aplicações da álgebra 
vetorial, no espaço-tempo de Minkowski. 


Exercícios 


4.6.1 (a) Mostre que todo quadrivetor no espaço de Minkowski pode ser decomposto em um vetor 
ordinário no espaço tridimensional e um escalar ordinário no espaço tridimensional. Exemplos: 
(ct, r), (p, pv/0), (co, ceoAÃ), (E/e, p), (w/c, k). 
Sugestão: Considere uma rotação das coordenadas do espaço tridimensional com tempo fixo. 
(b) Mostre que o inverso de (a) não é verdadeiro — todo trivetor mais um escalar não formam um 
quadrivetor de Minkowski. 


4.6.2 (a) Mostre que 
9; 
on «Ou 
dju =0: j= z O 
Tu 

(b) Mostre como a equação tensorial precedente pode ser interpretada como um enunciado da 

continuidade de carga e corrente em espaço e tempo tridimensionais ordinários. 
(c) Se sabemos que essa equação é válida em todas as estruturas de referência da Lorentz, por que 

não podemos concluir que j, é um vetor? 


4.6.3 Escreva a condição de calibre de Lorentz (Equação (4.143)) como uma equação tensorial no espaço 
de Minkowski. 
4.6.4 Uma transformação de calibre consiste em variar o potencial escalar y, e o potencial vetor A; de 


acordo com a relação 


Ox 
P2 Pita 
As = Aı — Vx 


A nova função x deve satisfazer a equação de onda homogênea 


2ra 1 02x — 
c2 at? 
Mostre o seguinte: 


(a) A relação de calibre de Lorentz não se altera. 
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(b) Os novos potenciais satisfazem as mesmas equações de onda não-homogêneas que os potenciais 
originais satisfaziam. 
(c) Os campos E e B não se alteram. 
A invariância de nossa teoria eletromagnética sob essa transformação é denominada invariância de 
calibre. 
4.6.5 Uma partícula carregada, carga q, massa m, obedece à equação covariante de Lorentz 
dp” 
p = E Fo, 
dr Eome 
em que p” é o vetor quadrimomento (E /c; pt, p°, p3), T é o tempo próprio, dr = dtv/1 — v2/c2, 
um escalar de Lorentz. Mostre que as formas espaço-temporais explícitas são 
dE dp 
— = qv - E; — =q(E+vxB). 
E VE g7 ) 
4.6.6 A partir dos elementos da matriz de transformação de Lorentz (Equação (4.158), derive a lei da 
adição de velocidade de Einstein 
; u—u u +ou 
U ou u= — 
1 — (uv/c2) 1+ (w'v/2)’ 
em que u = cdz? /dx? e u’ = cdg’? /dx'?. 
Sugestão: Se Lı2(v) é a matriz que transforma o sistema 1 no sistema 2, Los(u”) é a matriz que 
transforma o sistema 2 no sistema 3, Lis(u) é a matriz que transforma o sistema 1 diretamente 
no sistema 3, então Lis(u) = Los(u)Liyo(v). Dessa relação matricial extraia a lei da adição de 
velocidade de Einstein. 
4.6.7 O dual de um tensor quadridimensional de segunda ordem B pode ser definido por B, em que os 
elementos do tensor dual são dados por 
Bú- 1 stikl p 
J kl- 
Mostre que B se transforma em 
(a) um tensor de segunda ordem sob rotações, 
(b) um pseudotensor sob inversões. 
Note: Aqui, o til não significa transposta. 
4.6.8 Construa F, o dual de F, em que F é o tensor eletromagnético dado pela Equação (4.153). 
0 cBgy cB, cB, 
x cBy 0 E; -Ey 
Resposta: F”” = cy 
cB) —E, 0 E, 
cB; Ey — Er 0 
Isso corresponde a 
cB > -E, 
E > cB. 
Essa transformação, às vezes denominada transformação dual, deixa invariantes as equações de 
Maxwell no vácuo (p = 0). 
4.6.9 Como a contração quádrupla de um pseudotensor de quarta ordem e dois tensores de segunda ordem 
Euavof “A Evo é claramente um pseudo-escalar, avalie-o. 
Resposta: —8cgcB - E. 
4.6.10 | (a) Se um campo eletromagnético é puramente elétrico (ou puramente magnético) em um particular 


referencial de Lorentz, mostre que E e B serão ortogonais em outros sistemas de referência de 
Lorentz. 
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(b) Ao contrário, se E e B são ortogonais em um determinado referencial de Lorentz, existe um 
sistema de referência de Lorentz no qual E (ou B) desaparece. Ache esse sistema de referência. 


4.6.11 | Mostre que c?B2 — E? é um escalar de Lorentz. 


4.6.12 Visto que (dx?, dx!, dx?, dr?) é um quadrivetor, dx, dx! é um escalar. Avalie esse escalar para 
uma partícula em movimento em dois sistemas de coordenadas diferentes. (a) um sistema de 
coordenadas fixo em relação a você (sistema de laboratório) (b) em um sistema de coordenadas 
que se movimenta com uma partícula em movimento (velocidade v em relação a você). Rotulando 
o incremento de tempo por dr no sistema da partícula e por dt no sistema de laboratório, mostre 


que 
dr = dty1 — v2/c2. 


T é o tempo próprio da partícula, uma quantidade invariante de Lorentz. 


4.6.13 Expanda a expressão escalar 
1 1 
E AD 2 ud +—5 AM 
4c0 e (0) Ju 
em termos dos campos e potenciais. A expressão resultante é a densidade lagrangiana usada no 
Exercício 17.5.1. 


4.6.14 | Mostre que a Equação (4.157) pode ser escrita como 


ora 
af a = 
oxy 


4.7 Grupos Discretos 


Nesta seção, consideramos grupos com um número finito de elementos. Na física, os grupos costumam aparecer 
como um conjunto de operações que deixa um sistema inalterado, invariante. Essa é uma expressão de simetria. 
De fato, uma simetria pode ser definida como a invariância da hamiltoniana de um sistema sob um grupo de 
transformações. Simetria, neste sentido, é importante na mecânica clássica, mas se torna ainda mais importante e 
mais profunda na mecânica quântica Nesta seção investigamos as propriedades de simetria de conjuntos de objetos 
(átomos em uma molécula ou cristal). Isso nos dá ilustrações adicionais dos conceitos de grupo da Seção 4.1 
e leva diretamente a grupos diédricos. Por sua vez, grupos diédricos abrem o estudo dos 32 grupos pontuais 
cristalográficos e dos 230 grupos espaciais que são tão importantes em cristalografia e na física do estado sólido. 
Devemos citar que foi por meio do estudo de simetrias cristalinas que os conceitos de simetria e teoria dos grupos 
entraram na Física. Nesta área, as condições de grupos abstratos muitas vezes assumem significados físicos diretos 
em termos de transformações de vetores, spinores e tensores. 

Como exemplo simples, mas não trivial, de grupo finito, considere o conjunto 1, a, b, c, que se combina 
conforme a tabela de multiplicação de grupo? (veja a Figura 4.10). As quatro condições da definição de “grupo” 
estão claramente satisfeitas. Os elementos a, b, ce 1 são entidades matemáticas abstratas, sem nenhuma restrição, 
exceto a tabela de multiplicação da Figura 4.10. 


A œ SS 


Ss Omo 


= A 
Q =e 


Figura 4.10: Tabela de multiplicação de grupo. 


24A ordem dos fatores é linha-coluna: ab = c no exemplo anterior indicado. 
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Agora, para uma representação específica dos elementos desse grupo, façamos 


151, aa 


b> —l, c> ct, (4.164) 


b) 


combinados por multiplicação ordinária. Novamente, as quatro condições de grupo são satisfeitas e esses quatro 
elementos formam um grupo, que denominamos C4. Uma vez que a multiplicação dos elementos do grupo é 
comutativa, o grupo é denominado comutativo ou abeliano. Nosso grupo é também um grupo cíclico, no sentido 
de que os elementos podem ser escritos como potências sucessivas de um elemento, nesse caso 1”, n = 0, 1,2,3. 
Note que, escrevendo a Equação (4.164) selecionamos uma representação fiel específica para esse grupo de quatro 
objetos. 

Reconhecemos que os elementos de grupo 1,i, —1, —i podem ser interpretados como rotações sucessivas de 
90º no plano complexo. Então, pela Equação (3.74), criamos o conjunto de quatro matrizes 2 x 2 (substituindo 
— na Equação (3.74) para rotacionar um vetor em vez de rotacionar as coordenadas): 


cosy —seny 
R(g) = , 
seny coso 


e para Y = 0, T /2, T, e 37/2 temos 


SOE 


Esse conjunto de quatro matrizes forma um grupo, sendo que a lei de combinação é a multiplicação de matrizes. 
Temos, portanto, uma segunda representação fiel. Por multiplicação de matrizes verificamos que essa representação 
também é abeliana e cíclica. Há uma clara correspondência um-para-um entre as duas representações 


(4.165) 


111 asie A be -—1eB ceil. (4.166) 
No grupo C4 as duas representações (1, i, —1, —i) e (1, A, B, C) são isomórficas. 


Tabela 4.3 


Em contraste com isso, não existe tal correspondência entre qualquer dessas representações do grupo C4 e 
um outro grupo de quatro objetos, o Vierergruppe (Exercício 3.2.7). A tabela de multiplicação do Vierergruppe é 
mostrada na Tabela 4.3. Confirmando a falta de correspondência entre o grupo representado por (1, i, —1,—i) ou 
as matrizes (1, A, B, C) da Equação (4.165), note que, embora o Vierergruppe seja abeliano, não é cíclico. O grupo 
cíclico C4 e o Vierergruppe não são isomórficos. 


Classes e Caráter 
Considere um elemento de grupo x transformado em um elemento de grupo y por uma transformada de 
similaridade em relação a g; um elemento do grupo 


girg;* = y. (4.167) 


O elemento de grupo y é conjugado a x. Uma classe é um conjunto de elementos de grupo mutuamente 
conjugados. Em geral, esse conjunto de elementos que formam uma classe não satisfaz os postulados de grupo 
e não é um grupo. De fato, o elemento unitário 1, que é sempre uma classe por si só, é a única classe que também 
é um subgrupo. Todos os membros de uma dada classe são equivalentes, no sentido de que qualquer um dos 
elementos é uma transformada de similaridade de qualquer outro elemento. É claro que, se um grupo é abeliano, 
todo elemento é uma classe por si só. Constatamos que 
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1. Cada elemento do grupo original pertence a uma, e somente uma, classe. 
2. O número de elementos em uma classe é um fator da ordem do grupo. 


Obtemos uma possível interpretação física do conceito de classe observando que y é uma transformada de 
similaridade de x. Se g; representa uma rotação do sistema de coordenadas, então y é a mesma operação que zx, 
mas relativa às novas coordenadas relacionadas. 

Na Seção 3.3 vimos que uma matriz real se transforma sob rotação das coordenadas por uma transformação 
de similaridade ortogonal. Dependendo da escolha de estrutura de referência, por essência a mesma matriz 
pode assumir uma infinidade de formas diferentes. Do mesmo modo, nossas representações de grupo podem 
ser colocadas em uma infinidade de formas diferentes usando transformações unitárias. Mas cada uma dessas 
representações transformadas é isomórfica com a original. Pelo Exercício 3.3.9, o traço de cada elemento (cada 
matriz de nossa representação) é invariante sob transformações unitárias. Exatamente por ser invariante, o traço 
(sob o novo rótulo caráter) assume um papel de certa importância na teoria dos grupos, em particular em aplicações 
à física do estado sólido. É claro que todos os membros de uma dada classe (em uma dada representação) têm o 
mesmo caráter. Elementos de classes diferentes podem ter o mesmo caráter, mas elementos com caráter diferente 
não podem estar na mesma classe. 

O conceito de classe é importante (1) por causa do traço ou caráter e (2) porque o número de representações 
irredutíveis não-equivalentes de um grupo é igual ao número de classes. 


Subgrupos e Classes Laterais 
Fregiientemente, um subconjunto dos elementos do grupo (incluindo o elemento unitário I) satisfará por si só os 
quatro requisitos de grupo e, portanto, é um grupo. Tal subconjunto é denominado subgrupo. Todo grupo tem dois 
subgrupos triviais: o elemento unitário sozinho e o grupo em si. Os elementos 1 e b do grupo de quatro elementos 
C discutido antes forma um subgrupo não-trivial. Na Seção 4.1 consideramos SO(3) o grupo (contínuo) de todas 
as rotações em espaço ordinário. As rotações ao redor de qualquer um dos eixos formam um subgrupo de SO(3). 
Numerosos outros exemplos de subgrupos aparecem nas seções seguintes. 

Considere um subgrupo H com elementos h; e um elemento de grupo x que não está em H. Então, rh; e hix 
não estão no subgrupo H. Os conjuntos gerados por 


zhi, pd Dias e hiz, Dus 


são denominados classes laterais, respectivamente, os grupos laterais esquerdo e direito do subgrupo H em relação 
a x. Podemos mostrar (admita o contrário e prove uma contradição) que o grupo lateral de um subgrupo tem o 
mesmo número de elementos distintos que o subgrupo. Estendendo esse resultado, podemos expressar o grupo 
original G como a soma de H e dos grupos laterais: 


Então, a ordem de qualquer subgrupo é um divisor da ordem do grupo. É esse resultado que torna o conceito 
de grupo lateral significativo. Na seção seguinte o grupo de seis elementos D3 (ordem 6) tem subgrupos de ordem 
1, 2 e 3. Ds não pode ter (e não tem) subgrupos de ordem 4 ou 5. 
A transformada de similaridade de um subgrupo H por um elemento fixo de grupo que não está em H, rHx!, 
resulta em um subgrupo, Exercício 4.7.8. Se esse novo subgrupo é idêntico a H para todo zx, isto é, 
xH! = H 


b) 


então H é denominado subgrupo invariante, normal ou autoconjugado. Esses subgrupos estão envolvidos 
na análise de multipletos de espectros atômicos e nucleares e das partículas discutidas na Seção 4.2. Todos os 
subgrupos de um grupo comutativo (abeliano) são automaticamente invariantes. 


Dois Objetos — Eixo de Simetria Dupla 

Em primeiro lugar, considere o sistema bidimensional de dois átomos idênticos no plano xy em (1,0) e (—1,0), 
Figura 4.11. Quais rotações?” podem ser executadas (mantendo ambos os átomos no plano xy), que deixarão esse 
sistema invariante? O primeiro candidato é, obviamente, o operador unitário 1. A rotação de 7 radianos ao redor 
do eixo z completa a lista. Portanto, temos um grupo bastante desinteressante de dois membros (1, — 1). O eixo z 
é denominado eixo de simetria dupla — correspondente aos dois ângulos de rotação, O e 7, que deixam o sistema 
invariante. 


25 Aqui excluímos deliberadamente reflexões e inversões. Elas devem voltar à cena no desenvolvimento do conjunto completo de 32 grupos 
pontuais cristalográficos. 
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Figura 4.11: Moléculas diatômicas de H2, N2, O2, Clo. 


Nosso sistema fica mais interessante em três dimensões. Imagine agora uma molécula (ou parte de um cristal) 
com átomos do elemento X em +a no eixo y, e átomos do elemento Z em +c no eixo z, como mostra a Figura 4.12. 
Fica claro agora que cada eixo é um eixo de simetria dupla. Usando R,. (7) para designar uma rotação de 7 radianos 
ao redor do eixo x, podemos montar uma representação matricial das rotações como na Seção 3.3: 


1 0 0 -1 0 0 
Rm) =| 0 -1 0 |, Rm) =| 0 o l, 
0 0 E 0 0 —1 
(4.168) 
-1 0 0 100 
RŒ) =| 0 1 0 |, 1=|010 
0 0 1 001 


Esses quatro elementos [1, Re(7), Ry(7), R.(7)] formam um grupo abeliano. A tabela de multiplicação do grupo 
é mostrada na Tabela 4.4. 
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Tabela 4.4 
1 Ro(m) Ry(m) Ro(m) 
1 1 Re Ry Re 
Ro(m) | Ro 1 Rz Ry 
R(T) | R) Ro 1 Rz 
Realm) | Re Ry Rz 1 


Os produtos mostrados na Tabela 4.4 podem ser obtidos por um de dois modos distintos: (1) podemos analisar 
as operações em si — uma rotação de 7 ao redor do eixo x seguida por uma rotação de 7 ao redor do eixo 
y é equivalente a uma rotação de 7 ao redor do eixo z: Ry(n)Re(m) = R.(7). (2) Alternativamente, uma vez 
estabelecida uma representação fiel, podemos obter os produtos por multiplicação de matrizes. É aqui que se 
revela todo o poder da matemática, quando o sistema é muito complexo para uma interpretação física direta. 

A comparação com os Exercícios 3.2.7, 4.7.2 e 4.7.3 mostra que esse grupo é o Vierergruppe. As matrizes da 
Equação (4.168) são isomórficas com as do Exercício 3.2.7. Além disso, são redutíveis, já que são diagonais. Os 
subgrupos são (1, Rg), (1, Ry) e (1, Rz). Eles são invariantes. Deve-se notar uma rotação de 7 ao redor do eixo y e 
uma rotação de 7 ao redor do eixo x: R.(m)Ry(m) = Ry(7). Em termos de simetria, se y e z são eixos de simetria 
dupla, x é automaticamente um eixo de simetria tripla. 

Este grupo de simetria”, o Vierergruppe, costuma ser representado por D2, em que D significa um grupo 
diédrico e o índice 2 significa um eixo de simetria dupla (e nenhum eixo de simetria mais alta). 


Três Objetos — Eixo de Simetria Tripla 


Considere agora três átomos idênticos nos vértices de um triângulo equilátero, Figura 4.13. Rotações do triângulo 
de 0,27/3 e 47/3 deixam o triangulo invariante. Em forma matricial, temos?” 


Figura 4.13: Operações de simetria em um triângulo equilátero. 


26Um grupo de simetria é um grupo de operações que preserva a simetria, isto é, rotações, reflexões e inversões. Um grupo simétrico é o 
grupo de permutações de objetos distintos — de ordem n!. 
27 Note que aqui estamos rotacionando o triângulo em sentido anti-horário em relação a coordenadas fixas. 
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10 


= = f cos2m/3 —sen 27/3 \ f —1/2 —v3/2 
m a ( sen 27/3 cos27/3 ) = 3/2. —1/2 


-1/2 3/2 
-3/2 —1/2 J` 


B = R, (47/3) = ( (4.169) 


O eixo z é um eixo de simetria tripla. (1, A, B) formam um grupo cíclico, um subgrupo do grupo completo de seis 
elementos resultante. 

No plano xy há três eixos de simetria adicionais — sendo que cada átomo (vértice) e o centro geométrico 
definem um eixo. Cada um destes é um eixo de simetria dupla. Essas rotações podem ser descritas com muita 
facilidade dentro de nossa estrutura bidimensional introduzindo reflexões. A rotação de 7 ao redor do eixo C (ou 
y), que significa a permuta de átomos (sem estrutura) a e c, é apenas uma reflexão do eixo zx: 


-1 0 
C=Ro(m)= a (4.170) 


Podemos substituir a rotação ao redor do eixo D por uma rotação de 47/3 (ao redor de nosso eixo z) seguida por 
uma reflexão do eixo x (x — —«) (Figura 4.14). 


Figura 4.14: O triângulo da direita é o triângulo da esquerda rotacionado 180º ao redor do eixo D. D = CB. 


D = Ro(7) = CB 
-1 0 -1/2 8/2 
a 0 e a 
1/2  —=v3/2 
z ( -3/2 -1/2 ) 


De maneira similar, a rotação de 7 ao redor do eixo E, permutando a e b, é substituída por uma rotação de 27 /3(A) 
seguida por uma reflexão? do eixo z: 


(4.171) 


E=Re(r) = CA 


O ese -1/2 —v3/2 
o1 so -1/2 


1/2 3/2 
= 2 : (4.172) 
v3/2 —1/2 
A tabela completa de multiplicação do grupo é 
28Note que, como uma conseqüência dessas reflexões, det(C) = det(D) = det (E) 1. As rotações A e B, é claro, têm um determinante 


de +1. 
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1 A B C D E 
1/1 A B C D E 
AJA B 1 D E C 
BIB 1 A E C D 
CIC E D 1 B A 
DID C E A 1 B 
EIE D C B A 1 


Note que cada elemento do grupo aparece somente uma vez em cada linha e em cada coluna, como requer o 
teorema do rearranjo, Exercício 4.7.4. Além disso, pela tabela de multiplicação, vemos que o grupo é não-abeliano. 
Construímos um grupo de seis elementos e uma representação matricial 2 x 2 irredutível desse grupo. O único outro 
grupo distinto de seis elementos é o grupo cíclico [1, R, R2, R3, R$, R5], com 
R=er/8 qu R=e Tio = o Var (4.173) 
v3/2 1/2 
Nosso grupo [1, A, B, C, D, E] é denominado Ds em cristalografia, o grupo diédrico com um eixo de simetria tripla. 
Os três eixos (C, D e E) no plano xy automaticamente se tornam eixos de simetria dupla. Como consegiiência, 
(1, C), (1, D) e (1, E) formam subgrupos de dois elementos. Nenhum desses subgrupos de dois elementos de Ds é 
invariante. 
Um resultado geral e muito importante para grupos finitos de h elementos é que 


5 n2 =h, (4.174) 


em que n; é a dimensão das matrizes da i-ésima representação irredutível. Essa igualdade, às vezes denominada 
teorema da dimensionalidade, é muito útil para estabelecer as representações irredutíveis de um grupo. Aqui, para 
Ds temos 12 + 12 + 2? = 6 para nossas três representações. Não existe nenhuma outra representação irredutível 
desse grupo de simetria de três objetos. (As outras representações são a identidade e +1, dependendo de haver ou 
não uma reflexão envolvida.) 


Grupos Diédricos, D,, 

Um grupo diédrico D„ com eixo de simetria ênupla, implica n eixos com separação angular de 27/n radianos 
em que n é um inteiro positivo mas, sob qualquer outro aspecto, sem restrições. Se aplicarmos os argumentos de 
simetria a redes cristalinas, então n é limitado a 1, 2, 3, 4 e 6. O requisito de invariância da rede cristalina sob 
translações no plano perpendicular ao eixo ênuplo exclui n = 5,7 e valores mais altos. Tente cobrir completamente 
um plano com pentágonos regulares idênticos e sem nenhuma sobreposição.?? Para moléculas individuais, essa 
restrição não existe, embora os exemplos com n > 6 sejam raros; n = 5 é uma possibilidade real. Como exemplo, 
o grupo de simetria para o rutenoceno, (Cs Hs )oRu, ilustrado na Figura 4.15, é Ds. 


Grupos Cristalográficos Pontuais e Espaciais 

Os grupos diédricos que acabamos de considerar são exemplos de grupos pontuais cristalográficos. Um grupo 
pontual é composto de combinações de rotações e reflexões (incluindo inversões) que deixarão inalteradas algumas 
redes cristalinas. Limitar as operações a rotações e reflexões (incluindo inversões) significa que um ponto — a 
origem — permanece fixo, daí o termo grupo pontual. Incluindo os grupos cíclicos, dois grupos cúbicos (simetrias 
tetraédricas e octaédricas) e as formas impróprias (que envolvem reflexões), chegamos a um total de 32 grupos 
pontuais cristalográficos. 

Se, às operações de rotação e reflexão que produziram aqueles grupos pontuais acrescentarmos a possibilidade 
de translações e ainda exigirmos que algumas redes cristalinas permaneçam invariantes, chegamos aos grupos 
espaciais. Há 230 grupos espaciais distintos, um número assombroso, exceto, talvez, para os especialistas da área. 
Se quiser mais detalhes (que podem abranger centenas de páginas), veja Leituras Adicionais. 


Exercícios 
4.7.1 Mostre que as matrizes 1, A, B e C da Equação (4.165) são redutíveis. Reduza-as. 
Nota: Isso significa transformar A e C para a forma diagonal (pela mesma transformação unitária). 
Sugestão: A e C são anti-hermitianas. Seus autovetores serão ortogonais. 


29Para De imagine o plano coberto com hexágonos regulares e o eixo de rotação passando pelo centro geométrico de um deles. 
30Na verdade, o rótulo técnico completo é Ds, com A indicando invariância sob uma reflexão do eixo quíntuplo. 
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4.7.2 


4.7.3 


4.7.4 


4.7.5 


H 


Figura 4.15: Rutenoceno. 


Entre as operações possíveis em uma rede cristalina estão A, (rotação por 7), m (reflexão) e à 
(inversão). Essas três operações se combinam como 


E a ED ue 
A sm ==, 
Ar m=i, m- i= År, e i Ar =m. 


Mostre que o grupo (1, Ar, m, i) é isomórfico com o Vierergruppe. 


Quatro operações possíveis no plano são: 
15% 


1. nenhuma alteração f 
Y—> y 


; 5 -r 
2. inversão { 
y > -y 


= 


3. reflexão ( k 
y 


4. reflexão ( 


Voy. 

(a) Mostre que essas quatro operações formam um grupo. 
(b) Mostre que esse grupo é isomórfico com o Vierergruppe. 
(c) Monte uma representação matricial 2 x 2. 


Teorema do rearranjo: dado um grupo de n elementos distintos (1,a,b,c,...,n), mostre que o 

conjunto de produtos (al, a2, ab, ac... an) reproduz os n elementos distintos em uma nova ordem. 

Usando a representação matricial 2 x 2 do Exercício 3.2.7 para o Vierergruppe, 

(a) Mostre que há quatro classes, cada uma com um elemento. 

(b) Calcule o caráter (traço) de cada classe. Note que duas classes diferentes podem ter o mesmo 
caráter. 

(c) Mostre que há três subgrupos de dois elementos. (O elemento unitário, por si só, sempre forma 
um subgrupo.) 


ELSEVIER 


“livro” — 2007/8/1 — 15:06 — page 229 — #239 


4. TEORIA DOS GRUPOS 229 


4.7.6 


4.7.10 


4.7.11 


4.7.12 
4.7.13 


4.7.14 


4.7.15 


(d) Para qualquer um dos subgrupos de dois elementos mostre que o subgrupo e um único grupo 
lateral reproduzem o Vierergruppe original. 


Note que subgrupos, classes e grupos laterais são inteiramente diferentes. 
Usando a representação matricial 2 x 2, Equação (4.165), de C4, 


(a) Mostre que há quatro classes, cada uma com um elemento. 

(b) Calcule o caráter (traço) de cada classe. 

(c) Mostre que há apenas um subgrupo de dois elementos. 

(d) Mostre que o subgrupo e um único grupo lateral reproduzem o grupo original. 


Prove que o número de elementos distintos em um grupo lateral de um subgrupo é o mesmo que o 
número de elementos no subgrupo. 


Um subgrupo H tem elementos h;. Seja x um elemento fixo do grupo original G e não um membro 
de H. A transformada 
wS GZ 


zhix™t, 


gera um subgrupo conjugado x Hx” !. Mostre que esse subgrupo conjugado satisfaz cada um dos 
quatro postulados de grupo e, portanto, é um grupo. 


(a) Um determinado grupo é abeliano. Um segundo grupo é criado substituindo cada elemento do 
grupo original gi por g; 1. Mostre que os dois grupos são isomórficos. 
Nota: Isto significa mostrar que, se a;b; = c;, então a Ps = E 

(b) Continuando a parte (a), se os dois grupos são isomórficos, mostre que cada um deve ser 


abeliano. 


(a) Uma vez que você tenha uma representação matricial de qualquer grupo, uma representação 
unidimensional pode ser obtida usando os determinantes das matrizes. Mostre que as relações 
multiplicativas são preservadas nesta representação por determinante. 

(b) Use determinantes para obter um representante unidimensional de Ds. 


Xon? =h 


se aplica ao Vierergruppe (h = 4) e ao grupo diédrico D3 com h = 6. 


Explique como a relação 


Mostre que o subgrupo (1, A, B) de Ds é um subgrupo invariante. 

O grupo Ds pode ser discutido como um grupo de permutação de três objetos. A matriz B, 
por exemplo, rotaciona o vértice a (localização original 1) até a posição antes ocupada por c 
(localizacão 3). O vértice b muda da localização 2 para a localização 1, e assim por diante. Como 
uma permutação, (abc) — (bca). Em três dimensões 


0O 1 0 a b 
0 01 b = c 
1 0 0 c a 


(a) Desenvolva representações 3 x 3 análogas para os outros elementos de D3. 
(b) Reduza sua representação 3 x 3 para a representação 2 x 2 desta seção. 


(Essa representação 3 x 3 deve ser redutível ou a Equação (4.174) será violada.) 
Nota: Na verdade, a redução de uma representação redutível pode ser desajeitada. Muitas vezes é 
mais fácil desenvolver diretamente uma nova representação da dimensão requerida. 


(a) O grupo de permutação de quatro objetos P4 tem 4! = 24 elementos. Tratando os quatro 
elementos do grupo cíclico C4 como permutações, monte uma representação matricial 4 x 4 de 
Ca. C4 que se torna um subgrupo de P4. 

(b) Como você sabe que essa representação matricial 4 x 4 de C4 deve ser redutível? 

Nota: C4 é abeliano e todo grupo abeliano de h objetos tem somente h representações irredutíveis 

unidimensionais. 


(a) Os objetos (abcd) são permutados para (dacb). Escreva uma representação matricial 4 x 4 dessa 
permutação. 
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(b) A permutação (abdc) para (dacb) é ímpar ou par? 

(c) Essa permutação é um possível membro do grupo D4? Justifique sua resposta. 

4.7.16 | Os elementos do grupo diédrico D„ podem ser escritos na forma 

S*Rt(2m/n),  A=0,1 
u=0,1,... n— 1, 

em que R.(27/n) representa uma rotação de 27 /n ao redor do eixo de simetria ênupla, enquanto 

S representa uma rotação de 7 ao redor de um eixo que passa pelo centro do polígono regular e por 

um de seus vértices. 

Para S = E mostre que essa forma pode descrever as matrizes A, B, Ce D de Ds. 

Nota: Os elementos R, e S são denominados geradores desse grupo finito. De maneira semelhante, 

1 é o gerador do grupo dado pela Equação (4.164). 

4.7.17 Mostre que o grupo cíclico de n objetos, Cn, pode ser representado por r”, m = 0,1,2,...,n—1. 
Aqui, r é um gerador dado por 

r = exp(2ris/n). 

O parâmetro s assume os valores s = 1,2,3,...,n, sendo que cada valor de s resulta em uma 

representação unidimensional (irredutível) diferente de Cn. 

4.7.18 Desenvolva a representação matricial 2 x 2 irredutível do grupo de operações (rotações e reflexões) 
que transformam um quadrado nele mesmo. Dê a tabela de multiplicação de grupo. 

Nota: Este é o grupo de simetria de um quadrado e também o grupo diédrico D4. (Veja a 

Figura 4.16.) 

Figura 4.16: Quadrado. 

4.7.19 O grupo de permutação de quatro objetos contém 4! = 24 elementos. Pelo Exercício 4.7.18, D4, o 
grupo de D4, o grupo de simetria para um quadrado tem menos de 24 elementos. Explique a relação 
entre D4 e o grupo de permutação de quatro objetos. 

4.7.20 Um plano é coberto com hexágonos regulares, como mostra a Figura 4.17. 

(a) Determine a simetria diédrica de um eixo perpendicular ao plano que passa pelo vértice comum 
de três hexágonos (A). Isto é, se o eixo tiver simetria ênupla, mostre (com explicação detalhada) 
qual é n. Escreva a matriz que descreve a mínima rotação positiva (não-zero) do arranjo de 
hexágonos que é um membro de seu grupo Dn. 

(b) (b) Repita a parte (a) para um eixo perpendicular ao plano passando pelo centro geométrico de 
um hexágono (B). 

4.7.21 Em um cristal cúbico simples, poderíamos ter átomos idênticos em r = (la, ma, na), com l,m e n 


assumindo todos os valores inteiros. 


(a) Mostre que cada eixo cartesiano é um eixo de simetria quádruplo. 
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Figura 4.17: Hexágono. 


(b) O grupo cúbico consistirá em todas as operações (rotações, reflexões, inversão) que deixam o 
cristal cúbico simples invariante. Considerando a permutação dos eixos coordenados negativo 
e positivo, faça uma previsão de quantos elementos esse grupo cúbico conterá. 


4.7.22 (a) Pela tabela de multiplicação Ds da Figura 4.18, construa uma tabela de transformadas de 
similaridade mostrando xyx”*, onde as faixas de x e y abrangem todos os seis elementos de 
Ds. 
(b) Divida os elementos de D3 em classes. Usando a representação matricial 2 x 2 das 
Equações (4.169)-(4.172), observe o traço (caráter) de cada classe. 


Figura 4.18: Tabela de multiplicação. 


4.8 Formas Diferenciais 

Nos Capítulos 1 e 2 adotamos a visão de que, em n dimensões, um vetor é um ênupla de números reais e que 
seus componentes se transformam adequadamente sob mudanças das coordenadas. Nesta seção partimos da visão 
alternativa, na qual se imagina um vetor como um segmento de reta dirigido, uma seta. A finalidade da idéia é 
esta: embora o conceito de vetor como um segmento de reta não se generalize para espaço-tempo (variedades de 
geometria diferencial), exceto se trabalharmos no espaço plano tangente que requer a inserção de dimensões extras 
auxiliares, as formas diferenciais de Elie Cartan são naturais em espaço-tempo curvado e uma poderosa ferramenta. 
O cálculo pode ser baseado em formas diferenciais, como Edwards mostrou em seu livro clássico (veja as Leituras 
Adicionais). O cálculo de Cartan leva a uma notável unificação de conceitos e teoremas de análise vetorial que vale 
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a pena analisar. Agora, a utilização de formas diferenciais está amplamente disseminada em geometria diferencial 
e análise avançada (sobre variedades). 

A noção de Cartan de vetor é baseada na correspondência um-para-um entre os espaços lineares de vetores de 
deslocamento e operadores diferenciais direcionais (componentes do gradiente formam uma base). Uma vantagem 
crucial dos últimos é que eles podem ser generalizados para espaço-tempo curvado. Além do mais, descrever 
vetores em termos de derivadas direcionais ao longo de curvas especifica unicamente o vetor em um dado ponto 
sem a necessidade de invocar coordenadas. Em última instância, uma vez que precisamos de coordenadas para 
especificar pontos, o formalismo de Cartan, embora uma ferramenta matemática elegante para a derivação eficiente 
de teoremas de análise vetorial, em princípio não tem nenhuma vantagem sobre o formalismo de componente. 


1-Formas 


Definimos dx, dy, dz em espaço euclidiano tridimensional como funções que atribuem a um segmento de 
reta direcionado PQ do ponto P ao ponto Q a mudança correspondente em x,y,z. O símbolo dx representa 
“comprimento orientado da projeção de uma curva sobre o eixo x” etc. Note que dx, dy, dz podem, mas não, 
precisam, ser infinitesimalmente pequenos e não devem ser confundidas com as diferenciais ordinárias que 
associamos com integrais e quocientes diferenciais. Uma função do tipo 


Adr + B dy + C dz, A, B, C números reais (4.175) 


é definida como uma 1-forma constante. 


Exemplo 4.8.1 1-FORMA CONSTANTE 


Para uma força constante F = (A, B,C), o trabalho realizado ao longo do deslocamento de P = (3,2,1) a 
Q = (4,5,6) é dado por 


W = A(4 — 3) + B(5 — 2) + C(6 — 1) = A + 3B + 5C. 
Se F é um campo de força, então suas componentes retangulares A(x, y, z), B(x, y, z), C(£, y, z) dependerão 


da localização e a 1-forma (não-constante) dW = F - dr corresponderá ao conceito de trabalho realizado contra o 
campo de força F (r) ao longo de dr sobre uma curva no espaço. Uma quantidade finita de trabalho 


W = / [A(x,y, 2) de + B(x,y,2) dy + C(x, y, 2) dz] (4.176) 
c 


envolve a familiar integral de linha ao longo de uma curva orientada C em que a 1-forma dW descreve a quantidade 
de trabalho para pequenos deslocamentos (segmentos na trajetória C). Sob essa luz, o integrando f(x)dx de uma 
A b na a f i À ns f 

integral Ja f(a) da consistindo na função f e na medida dx como o comprimento orientado aqui é considerada 
uma l-forma. O valor da integral é obtido da integral de linha ordinária. E 


2-Formas 


Considere uma unidade de fluxo de massa na direção z, isto é, um fluxo na direção de z crescente, de modo que 
uma unidade de massa atravesse um quadrado unitário no plano xy em tempo unitário. A orientação simbolizada 
pela seqüência de pontos na Figura 4.19, 


(0,0,0) > (1,0,0) > (1,1,0) > (0,1,0) > (0,0,0), 


será denominada anti-horária, como de costume. Uma unidade de fluxo na direção z é definida pela função 
dx dy?! que atribui a retângulos orientados no espaço a área orientada de suas projeções no plano zy. De modo 
semelhante, um fluxo unitário na direção «x é descrito por dx dy = dy dx e um fluxo unitário na direção y por dz dz. 
A ordem inversa, dz dx, é ditada pela convenção de orientação e dz dx = —da dz por definição. Essa anti-simetria 
é consistente com o produto cruzado de dois vetores que representam áreas orientadas em espaço euclidiano. Essa 
noção é generalizada para polígonos e superfícies diferenciáveis curvadas aproximadas por polígonos e volumes. 


31 Muitos autores denotam este produto cunha como dg A dy com dy A dz = —dz A dy. Note que o produto dxdy = dyda para diferenciais 
ordinárias. 
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(1,1,0) 


Figura 4.19: Retângulo orientado em sentido anti-horário. 


Exemplo 4.8.2  FLUxO MAGNÉTICO ATRAVÉS DE UMA SUPERFÍCIE ORIENTADA 
Se B = (A, B, C) é uma indução magnética constante, então a constante 2-forma 


Adydz+ B dz dz + C dz dy 


descreve o fluxo magnético através de um retângulo orientado. Se B é um campo de indução magnética que varia 
através de uma superfície S, então o fluxo 


6 = i |B,(r) dy dz + By(r) dz da + B.(r) dx dy] (4.177) 
S 


através da superfície orientada © envolve a familiar integração (de Riemann) sobre retângulos orientados 
aproximadamente pequenos a partir dos quais .S é montada. E 


A definição de f w depende da decomposição de w = 57, wi, em que cada uma das formas diferenciais w; é não- 
nula apenas em um pequeno trecho da superfície S que cobre a superfície. Então, pode-se demonstrar que 51, f wi 
converge, porque os trechos ficam cada vez menores e mais numerosos, até o limite f w, que é independente dessas 
decomposições. Caso o leitor queira mais detalhes e provas, consulte Edwards nas Leituras Adicionais. 


3-Formas 

Uma 3-forma da dy dz representa um volume orientado. Por exemplo, o determinante de três vetores em espaço 
euclidiano muda de sinal se invertermos a ordem de dois vetores. O determinante mede o volume orientado 
abrangido pelos três vetores. Em particular, Jy p(z, y, 2) dx dy dz representa a carga total dentro do volume V 
se p for a densidade de carga. Formas diferenciais de dimensões mais altas em espaços de dimensões mais altas 
são definidas de maneira semelhante e denominadas formas k com k = 0,1,2,.... 


Se uma 3-forma 
w = A(z£1, £2, £3) dry dx dzz = A' (£1, £, £3) da) des das (4.178) 


em uma variedade tridimensional é expressa em termos de novas coordenadas, então há um mapa um-para-um, 
diferenciável, x; = x;(x£1, £2, £3), entre essas coordenadas com jacobiano 


Olx, 22, T3) 


J= =l 


3 


(T1, £2, £3) 


e A = A'J = A', de modo que 
/ w= / A dzı dxo dzz = A' da dz, dz}. (4.179) 
vV V v’ 


Essa declaração explica detalhadamente a independência de parâmetro de integrais sobre formas diferenciais, uma 
vez que, em essência, parametrizações são arbitrárias. As regras que governam a integração de formas diferenciais 
são definidas sobre variedades. Estas são contínuas se pudermos nos movimentar continuamente (na verdade, 
admitimos que elas são diferenciáveis) de ponto a ponto, e orientadas, se a orientação das curvas generalizar para 
superfícies e volumes até a dimensão de toda a base múltipla. As regras para formas diferenciais são: 
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e Se w = aw1 + a'w), sendo a, a, a” números reais, então fa w=a Je wi +a Jo w), em que S é uma variedade 
compacta, orientada, contínua, com fronteira. 
e Se a orientação for invertida, então a integral / g “ muda de sinal. 


Derivada Exterior 
Agora apresentaremos a derivada exterior d de uma função f, uma 0-forma: 


o o o o 
df = Îl ls ud + fiz ar 


que gera uma 1-forma wı = df, a diferencial de f (ou derivada externa), o gradiente na análise vetorial padrão. Ao 
fazer o somatório sobre as coordenadas, usamos, e continuaremos a usar, a convenção de somatório de Einstein. 
Aplicando a derivada exterior d a uma 1-forma, definimos 


d(A da + B dy + C dz) = dA dz + dB dy + dC dz (4.181) 


dzi, (4.180) 


com funções 4, B, C. Essa e EAO em conjunção com df exatamente como acabamos de dar, liga vetores a 
operadores diferenciais O; = = . De maneira semelhante, estendemos d para k-formas. Contudo, aplicar d duas 
vezes dá zero, ddf = 0, porque 


d(df) = dLdo taçidy 
= Ea 4 a da + i da + aS a dy 
= 9a ðr ðy * ðyðx dy? 
(2 N 
= (ari ss r) dz dy = 0. (4.182) 


Isso resulta do fato de que, em derivadas parciais mistas, a ordem não importa, contanto que todas as funções sejam 
suficientemente deriváveis. Do mesmo modo podemos provar que ddwı = O para uma w1, de 1-forma, etc. 

As regras que governam formas diferenciais, com wg denotando uma forma k, que usamos até aqui são 

dz dz = 0 = dy dy = dz dz, dx? = 0; 

da dy = —dy dz, dx; de; = —dx; de; i + j; 

dx, dxo --- dx, é totalmente anti-simétrica na dx;, i = 1,2,...,k. 

df = side; 

d(wk + Qk) = dwk + dO, linearidade; 

ddwķk =0. 

Agora aplicamos a derivada exterior d a produtos de formas diferenciais, começando com funções (0-forma). 
Temos 


d( fg) = UM q, i -(;2 p ) dei = fdg + dfo: (4.183) 


Tor 2.9 
Se wı = dede; é uma 1-forma e f é uma função, então 
d(fwi) =d fda; =d| f dg dx; 
a A -(2 og ag 
Zj 


= E + f dwn, (4.184) 


E) a an 


como esperado. Mas, se w} = dida; é uma outra 1-forma, então 
Fi 


ðg — of Og OF 
, = a > pan 
d(lwiwi) = (5 ET dz) (Z dx; dx; da; 
a (29 9f 
Ox; Ox; 
( dx; dx, dx; dx; 
o2g of ôg of 
nor dxy; driz da; 3 Ra Sð dxy da; 


= dwı w4 — w1 dw). (4.185) 
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Essa prova é válida para 1-formas mais gerais w = f; dx; com funções f;. Portanto, em geral, definimos k-formas: 
d(wpw!,) = (dwp ww), + (—1 Fw (do), (4.186) 


Em geral, a derivada exterior de uma k-forma é uma (k + 1) forma. 


Exemplo 4.8.3 ENERGIA POTENCIAL 
Como aplicação em duas dimensões (por simplicidade), considere o potencial V (r) uma 0-forma e dV sua derivada 
exterior. Integrando V ao longo de uma trajetória orientada C de rı até r temos 


V(r2)— V(ry) = f av= [Zat Za) Lv: dr, (4.187) 


em que a última integral é a fórmula-padrão para a diferença de potencial de energia que faz parte do teorema da 
conservação de energia. A trajetória e a independência de parametrização são evidentes nesse caso especial. E 


Retrocessos (pullbacks) 
Se um mapa linear L2 do plano uv para o plano xy tem a forma 


x = au + bv +c, y=eu+fuv-+g, (4.188) 


polígonos orientados no plano uv são mapeados para polígonos similares no plano xy, contanto que o determinante 
a L2 seja não-zero. A 2-forma 


da dy = (a du + bdv)(e du + f dv) = (af — be)du dv (4.189) 


pode ser traduzida de volta do plano xy para o plano uv. Isso significa que uma integral sobre uma superfície 
simplesmente conectada S se torna 


J dz dy = (af — v) [ du dv, (4.190) 
Lo(S) S 


e (af — be) du dv é o retorno de dz dy, oposto à direção do mapa Lə do plano uv para o plano zy. É claro que o 
determinante a f — be do mapa L2 é simplesmente o jacobiano, gerado sem muito esforço pelas formas diferenciais 
na Equação (4.189). 
De modo semelhante, um mapa linear L3 do espaço uj u2us para O espaço ri 1213 
Ti = Qjuj + bi, 1=1,2,83, (4.191) 


gera automaticamente sua forma jacobiana a partir da forma 


3 3 3 
dx das das fm [> Qij au) (£ Q2j du) [> a3j da) 
j=1 j=1 j=1 


= (ar 022433 — Q12021033 E + Jduy dus dus 


= det Q21 Q22 Q23 duı duz dus. (4.192) 


Assim, formas diferenciais geram as regras que governam determinantes. 
Dados dois mapas lineares em seqüência é possível provar diretamente que o retrocesso sob um mapa composto 
é o retrocesso do retrocesso. Este teorema é o análogo em formas diferenciais da multiplicação de matrizes. 
Agora vamos considerar a curva C definida por um parâmetro t em contraste com uma curva definida por uma 
equação. Por exemplo, o círculo {(cos t, sen t);0 < t < 27} é uma parametrização por t, ao passo que o círculo 
f(x,y); £? + y? = 1) é uma definição por uma equação. Então, a integral de linha 


t 
/ [A(x, y)dz + B(x,y) dy] = 1 Í E + B% dt (4.193) 
C t; dt 
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para funções contínuas A, B, dx/dt, dy/dt se torna uma integral unidimensional sobre o intervalo orientado 
ti < t < tg. Claramente, a l-forma [A SE + BS] dt na linha t é obtida da 1-forma Adz + B dy no plano 
xy via o mapa zy x = x(t), da linha t para a curva C no plano xy. A l-forma [Ade + BS] dt é denominada 
retrocesso da l-forma A dx + B dy sob o mapa x = z(t), y = y(t). Usando retrocessos podemos mostrar que 
integrais sobre 1-formas são independentes da parametrização da trajetória. 

Nesse sentido, o quociente diferencial su pode ser considerado o coeficiente de dx no retorno de dy sob a 
função y = f(x) ou dy = f'(x) dx. Esse conceito de retrocesso se generaliza imediatamente para mapas em três 
ou mais dimensões e para k-formas com k > 1. Em particular, pode-se verificar que a regra da cadeia é um retorno: 
Se 


Yi = fili Tare En); wS PR e 
mn)  j=1,2,..., m (4.194) 


são mapas diferenciáveis de R” — R! e R! — R”, então o mapa composto R” — R” é diferenciável e o 
retrocesso de qualquer k-forma sob o mapa composto é igual ao retrocesso do retrocesso. Esse teorema é útil para 
estabelecer que integrais de k-formas são independentes de parâmetro. 

De forma semelhante, definimos a diferencial df como o retrocesso da 1-forma dz sob a função z = f(x,y): 


dz = df = “dr + “dy. (4.195) 


Exemplo 4.8.4 TEOREMA DE STOKES 


Como outra aplicação, em primeiro lugar vamos esboçar a derivação-padrão da versão mais simples do teorema de 
Stokes para um retângulo S = [a < x < b,c < y < d] orientado em sentido anti-horário, sendo OS sua fronteira 


b d a c 
f (Adir+Ba)= | Amede + | Bosa | Aa a) do+ f B(a,y) dy 
os a c b d 
b 


d 
= [ [B(b, y) — B(a, y)] dy = f LA(x,d) — A(x, c)] da 


d pb b pd 
oB oA 
- [ J ddy- | f gon 


ðB ðA 
= ME = 5) dz dy, (4.196) 


que vale para qualquer superfície simplesmente conectada § que possa ser reunida por retângulos. 
Agora demonstramos a utilização de formas diferenciais para obter o mesmo teorema (novamente em duas 
dimensões, por simplicidade): 


d(A da + B dy) = dA dx + dB dy 
oA oA ƏB 3B ƏB ðA 
TN a “S d — dy | dy = | — — — | dzd 
(i+ dy 1) do+ (a q + dy v) y E 5) a dy, 
(4.197) 


usando as regras destacadas anteriormente. Integrando sobre uma superfície S e sua fronteira ôS, respectivamente, 
obtemos 


(Ade + Bay = | alAdo+ Bay) = f (SE - SO) de dy. (4.198) 
as s s\ôx Oy 


Aqui, as contribuições à integral da esquerda advindas de fronteiras internas se cancelam como de hábito, porque 
são orientadas em direções opostas sobre retângulos adjacentes. Para cada retângulo interno orientado que compõe 
a superfície simplesmente conectada S, usamos 


f ddx a da = 0. (4.199) 
R ƏR 
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Note que a derivada exterior gera automaticamente a componente z do rotacional. 
Em três dimensões, o teorema de Stokes deriva da identidade de forma diferencial que envolve o potencial vetor 
A e a indução magnética B = V x A, 


(A, dx + A, dy + A, dz) = dA, de + dA, dy + dA, dz 


DA, DA OA, 
= ( e da + dy dy + E dedo 


= Ola e O dy dz + dÃso DA, dz da + é z DAz dz dy, 
Oy oz oz ox z y 


(4.200) 


gerando todos os componentes do rotacional em espaço tridimensional. Essa identidade é integrada sobre cada 
retângulo orientado que compõe a superfície simplesmente conectada S (que não tem buracos, isto é, onde cada 
curva se contrai até um ponto da superfície) e então é somada sobre todos os retângulos adjacentes, para resultar o 
fluxo magnético através de S, 


-= fie dy dz + By dz dx + B, da dy] 
S 
= J [Ar dx + Ay dy + A, dz], (4.201) 
os 
ou, na notação-padrão de análise vetorial (teorema de Stokes, Capítulo 1), 
[B-da= [(VxA)-da- A-dr. (4.202) 
sS s os 
E 
Exemplo 4.8.5 TEOREMA DE GAUSS 
Considere a lei de Gauss, Seção 1.14. Integramos a densidade elétrica p = iv * E sobre o volume de um único 


paralelepípedo V = fa < x < b,c < y < d,e < z < f] orientado por dz dy dz (para o lado direito), o lado x = b 
de V orientado por dy dz (sentido anti-horário, como vemos por x > b), e assim por diante. Usando 


“9E, 


Ew(b, 3,2) — Es(a,y,2) = Era 


dz, (4.203) 


a 


temos, na notação de formas diferenciais, somando sobre todos os paralelepípedos que compõem o volume VY, 


J Ez dy dz = / dE dz dy dz. (4.204) 
əv v ð 


x 
Integrando a identidade (2-forma) do fluxo elétrico 


dE, dy dz + E, dz de + E, dz dy) = dE, dy dz + dE, dz de + dE, de dy 


_ (0E: dE, 0E, 
= ( dx + dy + dz da dy dz (4.205) 


sobre a superfície simplesmente conectada OV temos o teorema de Gauss, 


dE, OE oE, 
/ (Ex dy dz + E, dz de + E, de dy) = 1, +-+ dz dy dz, (4.206) 
əv vi x Oy oz 
ou, em notação-padrão de análise vetorial, 
/ E-da= | V-Bdr= £ (4.207) 
əv v E0 
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Esses exemplos são casos diferentes de um único teorema sobre formas diferenciais. Para explicar por que, 
vamos começar com um pouco de terminologia, uma definição preliminar de uma variedade diferenciável 
M: ela é uma coleção de pontos (m-tuplas de números reais) que são conectados suavemente (isto é, 
diferenciavelmente) uns com os outros, de modo que a vizinhança de cada ponto parece ser um pedaço 
simplesmente conectado de um espaço cartesiano m-dimensional “suficiente próximo” ao redor do ponto e que o 
contém. Aqui, m, que permanece constante de ponto a ponto, é denominada dimensão da variedade. São exemplos 
o espaço euclidiano m-dimensional R” e a esfera m-dimensional 


m+1 
Sm = (aranes ig a ysy si š 
i=1 
Qualquer superfície com bordas agudas, cantos ou vazios não é uma base múltipla em nosso sentido, isto é, não 
é diferenciável. Em geometria diferencial, todos os movimentos, tais como translação e deslocamento paralelo, 
são locais, isto é, são definidos por infinitésimos. Se aplicarmos a derivada exterior d a uma função f(ax!,...,a”) 
sobre M, geramos 1-formas básicas: 


EA 


df dat, (4.208) 


em que xt (P) são funções coordenadas. Como antes, temos d(df) = 0 porque 


o 0? 
duro (=) das Lda? da” 
= o? f A q RR 
= a (55 du Ox L) dx’ dx' = 0 (4.209) 


porque a ordem das derivadas não importa. Qualquer 1-forma é uma combinação linear w = $; wi dx* com 
funções w;. 


Teorema de Stokes Generalizado sobre Formas Diferenciais 


Seja w uma forma (k — 1) contínua no espaço x 12 - -- x, definida em todos os lugares sobre uma variedade S 
compacta, orientada, diferenciável, k-dimensional, com fronteira OS em espaço x,%5 £n. Então 


f v= | dw, (4.210) 
os S 


dw = d(Adzı dzz- -d£p-1 +- ) = dA dzı des dera +. (4.211) 


Aqui 


A energia potencial no Exemplo 4.8.3, dado esse teorema para o potencial w = V, 0-forma; o teorema de Stokes no 
Exemplo 4.8.4 é esse teorema para o potencial vetorial 1-forma >), A; dx; (para espaços euclidianos dx = dx;); 
e o teorema de Gauss no Exemplo 4.8.5 é o teorema de Stokes para o fluxo elétrico 2-forma no espaço euclidiano 
tridimensional. 

O método de integração por partes pode ser generalizado para formas diferenciais usando a Equação (4.186): 


f an= f N fm dws. (4.212) 
S os S 


Isto é provado integrando a identidade 
d(wiw2) = dwy wa + (1) w: dw2, (4.213) 


com o termo integrado Ja d(wiw2) = Jos Wwa. 


Nosso próximo objetivo é colocar as Seções 2.10 e 2.11 na linguagem das formas diferenciais. Até aqui 
trabalhamos em espaço euclidiano bi ou tridimensional. 
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Exemplo 4.8.6 VARIEDADE DE RIEMANN 


Vamos examinar o espaço-tempo curvado de Riemann das Seções 2.10-2.11 e reformular um pouco dessa análise 
tensorial em espaços curvos na linguagem das formas diferenciais. Lembre-se de que, aqui, é importante distinguir 
entre índices inferiores e superiores. A métrica g;; Equação (2.123) pode ser escrita em termos de vetores tangentes, 
Equação (2.114), como segue: 

ðx! ox 


9i = a DE’ (4.214) 


em que a soma sobre o índice | denota o produto interno dos vetores tangentes. (Aqui continuamos a usar a 
convenção da soma de Einstein sobre índices repetidos. Como antes, o tensor métrico é usado para elevar e reduzir 
índices repetidos). O conceito fundamental de conexão envolve os símbolos de Christoffel, que abordamos em 
primeiro lugar. A derivada exterior de um vetor tangente pode ser expandida em termos da base de vetores tangentes 
(compare com a Equação (2.131a)), 


l l 
(5) =p Ca (4.215) 


introduzindo, desse modo, os símbolos de Christoffel da segunda espécie. Aplicando d à Equação (4.214), obtemos 
gij Ox Ox Ox! (0x 

dgi; = = dq” = d - - -d - 4.216 

TO (gr) dq * og" Da GSN 


Ox, Og! Ox! Ox; 
pra na k Ma sv Ar d ga 
( dq" Og)" Mag sa) 


= (D imgkj +D" jmgik)dg” 
Comparando os coeficientes de dq”, temos 


Ogi j 


k k 


Usando o símbolo de Christoffel da primeira espécie, 


lij, M] = grm "iz, (4.218) 
podemos reescrever a Equação (4.217) como 
Ogijo SER 
dare = lim, j] + lim, (4.219) 


o que corresponde à Equação (2.136) e implica a Equação (2.137). Verificamos que 


a = 1 /Ôgim Ogjm Ogiz 
lij, m] = 1 TA DI (4.220) 


é a única solução da Equação (4.219) e que 


E 1 gi gj gij 
Ig = g = igs | 22 +55 a 4.221 

resulta disso. E 
Operador* de Hodge 

As diferenciais dx", i = 1, A m, formam uma base de um espaço vetorial que é considerado dual em 
relação às derivadas O; = 57 o ajas são l-formas básicas. Por exemplo, o espaço vetorial V = { (aa, a2,a3)} 
é dual ao espaço ui de planos (funções lineares de f) em espaço euclidiano tridimensional V* = {f = 
ax + ago + a3z3 — d = 0}. O gradiente 


= OE, Əf DRA 
Vf = (2. dra! se) = (a1, a2, a3) (4.222) 
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dá um mapa um-para-um, diferenciável, de V* para V. Essas relações duais são generalizadas pelo operador * de 
Hodge, baseado no símbolo de Levi-Civita da Seção 2.9. 

Sejam os vetores unitários X; uma base ortonormal orientada do espaço euclidiano tridimensional. Então o * de 
Hodge de escalares é definido pelo elemento de base 


1 
+= TRAC = RikoXs, (4.223) 


que corresponde a (% X $2) - X3 em notação vetorial padrão. Aqui, X;X;% é o produto externo totalmente anti- 


* 4 


simétrico dos vetores unitários que corresponde a (%; x X;) - Xy em notação vetorial padrão. Para vetores, * é 
definido para a base de vetores unitários como 
Ed DE 
xŠ; = ati X;Xk- (4.224) 
Em particular, 
xı = R23, *X9 = XsX1, *X3 = Rifo. (4.225) 
Para áreas orientadas, * é definido sobre elementos de área de base como 
AoA EE RÃS SA 
*(X;%;) = E ijXk, (4.226) 
portanto, 
*(Ri%o) = eis = &s, *(X1%3) = €132 = —Ro, 
*(Xo%X3) = elo3ĝı = Xi. (4.227) 
Para volumes, * é definido como 
*(X1XoX3) = €123 = 1. (4.228) 
Exemplo 4.8.7 PRODUTO EXTERNO DE VETORES 
O produto externo de dois vetores 
3 3 
a= 5 atki, b= 5 bk; (4.229) 
i=1 i=1 


é dado por 
3 3 
ab = ( s) 2 vs) =3 (aii — atb) kik, (4.230) 
i=1 j=1 i<j 
ao passo que a Equação (4.224) implica 
x(ab) = a x b. (4.231) 


E 
Em seguida, vamos analisar as Seções 2.1-2.2 sobre coordenadas curvilíneas na linguagem das formas 
diferenciais. 


Exemplo 4.8.8  LAPLACIANO EM COORDENADAS ORTOGONAIS 
Considere coordenadas ortogonais onde a métrica (Equação (2.5)) leva a elementos de comprimento 


ds; = hi dqi, não somados. (4.232) 
Aqui, as dq; são diferenciais ordinárias. As 1-formas associadas com as direções ĝ; 
ct = hidqi, não somadas. (4.233) 


Então o gradiente é definido pela 1-forma 


df = = dqi = (za jA (4.234) 
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Aplicamos o operador de Hodge a df, gerando a 2-forma 


sendo i E RA 1 Əf\ sa 1 ðf 
t= (E) we = (E) TA Eeh Ta Om ele? 


hsha O h hiho O 
= (23 f das das + | — ha 05 das dy + | = Ena o dqı dgo. 
qı ho q2 3 Oda 


(4.235) 


Aplicando uma outra derivada exterior d, obtemos o laplaciano 
Ə (hahs e) o (55 of 
dqı dq2 dq3 + =— E 
Og ( hı Oq o dia h2 Ogo 


q2 
ð -a 

= —— | das dqı dq d 
> ha Oq q3 AG 4q2 43 


x 1 | (8) Es 1) j Fo) Eu 21) sã ð Eu | 
hahaha [Og À ha Og ðq2 ho q q3 À hz q3 


cele2es = V? f dan dgo das. (4.236) 


d(+df) = ) dgo dqı dgo dq3 


Dividindo pelo elemento de volume, temos a Equação (2.22). Lembre-se de que os elementos de volume da dy dz 
e c!c2eê devem ser iguais porque c' e dx, dy, dz são 1-formas ortonormais e o mapa de xyz para as q; coordenadas 
é um-para-um. E 


Exemplo 4.8.9 EQUAÇÕES DE MAXWELL 

Agora trabalhamos em espaço quadridimensional de Minkowski, o espaço-tempo plano, homogêneo, da 
relatividade especial, para discutir a eletrodinâmica clássica em termos de formas diferenciais. Começamos 
introduzindo o campo eletromagnético 2-forma (tensor de campo em notação relativista padrão): 


F = — E, dt dx — E, dt dy — E, dt dz + B, dy dz + By dz dx + B, dx dy 
1 
= 5 uu do do”, (4.237) 


que contém a l-forma elétrica E = E, dx + E, dy + E, dz e o fluxo magnético 2-forma. Aqui, termos com 
1-formas em ordem oposta foram combinados. (Para a Equação (4.237) ser válida, a indução magnética está em 
unidades de c; isto é, B; — cB; sendo c a velocidade da luz ou trabalhamos em unidades em que c = 1. Além 
disso, F está em unidades de 1/zo, a constante dielétrica do vácuo. E mais, o potencial vetorial é definido como 
Ao = €o4, com o potencial elétrico não-estático ġ e A! = o .. . (veja a Seção 4.6 se quiser mais detalhes). O 
campo F de 2-forma abrange a lei da indução de Faraday que diz que uma carga em movimento sofre a ação de 
forças magnéticas. 
Aplicando a derivada exterior d, geramos automaticamente as equações homogêneas de Maxwell por F: 


dF = (aw dEs e (a + Td) dtdy 
A 


Oy 
(Gde + dy) dede + (S ca ) ava: 
+ (ras Pu) dz da + (e aos ) dedy 
s H ' iu y I) ataray+ ( -e o) ddz az 
+( i E = $ | Hiisi (4.238) 


que, em notação-padrão de análise vetorial, toma a familiar forma vetorial de equações homogêneas de Maxwell, 


VxE+ ĉB =0. (4.239) 
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Uma vez que dF = 0, isto é, não há nenhum termo-guia, de modo que F é fechada e deve existir um w = A, da” 
l-forma, de modo que F = dw. Agora, 
dw = 9, Ay da” da”, (4.240) 


que, em notação-padrão leva à forma relativista convencional do tensor de campo eletromagnético, 
Fav = 0p Av — Oy Ap- (4.241) 


Assim, as equações homogêneas de Maxwell, dF = 0, são equivalentes a 0” Fuy = 0. 
Para derivar dessa mesma forma as equações não-homogêneas de Maxwell, introduzimos o tensor dual de 
campo eletromagnético 


~ 1 
pre = zE Fap, (4.242) 
e, em termos de formas diferenciais, 


xF = Po da” da”) = Pv * (da! da”) = : mé ag do da. (4.243) 


Aplicando as derivadas exteriores, obtemos 
1 
d(xF) = z oplê Fu) da” da” da”, (4.244) 


o lado esquerdo das equações não-homogêneas de Maxwell, uma 3-forma. Seu termo-guia é o dual da densidade 
de corrente elétrica, uma 3-forma: 


xJ = Ja(*dz®) = ES pva dz” da 
= pdz dy dz — Jr dt dy dz — Jy dt dz dx — J, dt dz dy. (4.245) 


No todo, as equações não-homogêneas de Maxwell tomam a elegante forma 


d(xF) = xJ. (4.246) 

A estrutura de forma diferencial trouxe considerável unificação à álgebra vetorial e, de forma mais geral, 

à análise tensorial variedades, tal como a união dos teoremas de Stokes e Gauss, forneceu uma reformulação 
elegante das equações de Maxwell e uma derivação do laplaciano em coordenadas ortogonais curvas, entre outras. 


Exercícios 
4.8.1 Avalie a 1-forma a dx + 2b dy + 4c dz no segmento de linha PQ, com P = (3,5,7), Q = (7,5,3). 
4.8.2 Se o campo de força é constante e movimentar uma partícula da origem até (3, 0, 0) requer a unidade 


de trabalho, de (—1, —1,0) a (—1, 1,0) exige b unidades de trabalho e de (0, 0, 4) a (0,0, 5) precisa 
de c unidade de trabalho, ache a 1-forma do trabalho. 


4.8.3 Avalie o fluxo descrito pela 2-forma dz dy + 2 dy dz + 3 dz dx através do triângulo orientado PQR 
com vértices em 
P = (3,1,4), Q = (—2,1, 4), R= (1,4,1). 


4.8.4 Os pontos, na ordem dada a seguir, 
(0,1,1), (3, —1,—2), (4,2, —2), (—1,0,1) 


são coplanares ou formam um volume orientado (para o lado direito ou para o lado esquerdo)? 
4.8.5 Escreva a lei de Oersted, 


Hdr= | YV xH- da~T, 

os S 
em notação de forma diferencial. 

4.8.6 Descreva o campo elétrico pela 1-forma E; dx + Es dy + Es dz e a indução magnética pela 
2-forma Bı dy dz + Bs dz da + Bs da dy. Então formule a lei de Faraday da indução em termos 
dessas formas. 
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4.8.7 Avalie a 1-forma 
x dy y da 


r? + y? z? + y? 


no círculo unitário ao redor da origem, com orientação anti-horária. 
4.8.8 Ache o retrocesso de dr dz sob x = u cos v, y = u — v, 


4.8.9 Ache o retrocesso da forma dy dz + dz dx + dx dy sob o mapa x = sen 0 cos ọ, y = sen sen qo, 
z = cos 0. 

4.8.10 Parametrize a superfície obtida pela rotação do círculo (x — 2)? + z? = 1, y = 0 ao redor do eixo 
z com orientação em sentido anti-horário, como visto de fora. 


4.8.11 Uma l-forma A dz + B dy é definida como fechada se A = dB, É denominada exata se houver 


uma função f, tal que ES = Ae a = B. Determine quais das seguintes 1-formas são fechadas ou 
exatas e ache as funções correspondentes f para as que são exatas: 


y da + a dy z 
y da + z dy, RR [In(xy) + 1] de + —dy, 
y y 
y dz x dy 


SENT RR f(z) dz com z = z + iy. 
4.8.12 Mostre que 51º, x? = a? define uma base múltipla diferenciável de dimensão D = n— 1 se a £0 
e D =0sea = 0. 


4.8.13 Mostre que o conjunto de matrizes ortogonais 2 x 2 forma uma base múltipla diferenciável e 
determine sua dimensão. 


4.8.14 Determine o valor da 2-forma A dy dz + B dz dx + C dz dy sobre um paralelogramo com lados 
a,b. 


4.8.15 Prove a invariância de Lorentz das equações de Maxwell na linguagem das formas diferenciais. 
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Séries Infinitas 


5.1 Conceitos Fundamentais 


Séries infinitas, literalmente somas de um número infinito de termos, ocorrem com frequência tanto na matemática 
pura quanto na aplicada. Elas podem ser usadas pelo matemático puro para definir funções como uma abordagem 
fundamental da teoria de funções, bem como para calcular valores precisos de constantes transcendentais e funções 
transcendentais. Na matemática da Ciência e da Engenharia, as séries infinitas estão por toda parte, porque 
aparecem na avaliação de integrais (Seções 5.6 e 5.7), na solução de equações diferenciais (Seções 9.5 e 9.6) e 
como séries de Fourier (Capítulo 14) e competem com as representações integrais na descrição de um grande 
número de funções especiais (Capítulos 11, 12 e 13). Na Seção 16.3, a solução da série de Neumann para equações 
integrais nos dá mais de um exemplo da ocorrência e utilização de séries infinitas. 

Desde o início enfrentamos o problema de atribuir significado à soma de um número infinito de termos. 
A abordagem usual é a das somas parciais. Se temos uma seqüência infinita de termos uy, U2, U3, U4, U5,..., 


definimos a i-ésima soma parcial como 
i 
Si = ) Uia (5.1) 
n=1 


Essa é uma soma finita e não oferece dificuldade alguma. Se as somas parciais s; convergem para um limite (finito), 
à medida que i — oo, 
lim s; = S, (5.2) 


1—00 
diz-se que a série infinita 5? , Un é convergente e tem o valor S. Note que, de um modo razoável, plausível, 
porém ainda assim arbitrário, definimos a série infinita como igual a S e que uma condição necessária para 
essa convergência para um limite é que lim, 00 Un = 0. Entretanto, essa condição não é suficiente para garantir 
convergência. A Equação (5.2) costuma ser escrita em notação matemática formal: 


A condição para a existência de um limite S é que, para cada £ > 0, haja um N = N (e) fixo tal que 
IS— si| <€, parai > N. 


Essa condição é freqüentemente derivada do critério de Cauchy aplicado às somas parciais s;. O critério de 
Cauchy é: 
Uma condição necessária e suficiente para que uma seqüência (s;) convirja é que, para cada £ > 0, haja um 
número fixo N tal que 
[= si| < £, para todo i, j > N. 


Isso significa que as somas parciais individuais devem se agrupar à medida que avançamos bastante na seqüência. 
O critério de Cauchy pode ser estendido com facilidade para seqüências de funções. Nós o vemos nessa forma 
na Seção 5.5, na definição de convergência uniforme, e na Seção 10.4, no desenvolvimento do espaço de Hilbert. 
Nossas somas parciais s; podem não convergir a um limite único, mas oscilar, como no caso 


Soum=1>1+1>1+1 +00 (IP + 


n=1 


E claro que, s; = 1 para ímpar, mas s; = 0 para à par. Não há nenhuma convergência para um limite, e séries como 
essa são denominadas oscilantes. Sempre que a sequência de somas parciais divergir (aproximar-se de +oo), diz- 
se que a série infinita diverge. Muitas vezes, o termo divergente é ampliado para incluir também séries oscilantes. 


245 
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Como avaliamos as somas parciais pela aritmética comum, a série convergente, definida em termos de um limite 
das somas parciais, assume uma posição de suprema importância. Dois exemplos podem esclarecer a natureza de 
convergência ou divergência de uma série e também servirão como base para uma investigação mais detalhada na 
próxima seção. 


Exemplo 5.1.1 A SÉRIE GEOMÉTRICA 
A seqüência geométrica, começando com a e com uma razão r (= an+1/4an independente de n), é dada por 
atartar? tar +- tala... 


A enésima soma parcial é dada por! 


17” 
Sn = a=. (5.3) 
l-r 
Tomando o limite para n — oo, 
lim s, =, paraļr| <1. (5.4) 
n>o00 l=> 
Daí, por definição, a série geométrica infinita converge para |r| < 1 e é dada por 
a = L., (5.5) 
l-r 
n=1 
Por outro lado, se |r| > 1, a condição necessária un — 0 não é satisfeita e a série infinita diverge. 
Exemplo 5.1.2 A SÉRE HARMÔNICA 
Como um segundo exemplo mais complicado, consideramos a série harmônica 
+ 1 1 1 1 
So==1+5+5+5+0+ D+. (5.6) 
n 2 3 4 n 


Temos o lim, oo Un = limpo 1/n = 0, mas isso não é suficiente para garantir convergência. Se agruparmos os 
termos (nenhuma alteração na ordem) como 


DEAD ARA DA, 67 
cada par de parênteses inclui p termos da forma 


1 1 1 pa 


E E E RR E 5.8 
p+1 p+2 p+p 2p 2 (3:3) 
Formando somas parciais pela adição dos grupos entre parênteses, um por um, obtemos 
5 
s1 = 1, S4 > 2 
3 6 
2 = 5 Pa go (5.9) 
e 4 E n+1 
s = Sn : 
ne, 2 


A 


Considerada dessa maneira, a série harmônica é certamente divergente? Uma demonstração alternativa e 
independente de sua divergência aparece na Seção 5.2. E 


Se os un > 0 estão decrescendo monotonicamente para zero, isto é, un > Un+1 para todo n, então pa Un está 
convergindo para S se, e somente se, Sn — Num convergir para S. À medida que as somas parciais sn convergem 
para S, esse teorema indica que nu, — 0, para n — 00. 

Para provar esse teorema, começamos por concluir de O < un+1 < Un € 


Sn41 — (N + Dunsi = Sn — NUn+1 = Sn — NUn + Un — Un+1) > Sn — NUn 


!Multiplique e divida sn = Ymo 47” porl — r. 
2A série harmônica (finita) aparece em uma nota interessante sobre o máximo deslocamento estável de uma pilha de moedas. P. R. Johnson, 


“The Leaning Tower of Lire”. Am. J. Phys. 23: 240 (1955). 
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que Sn — nu, aumenta à medida que n — oo. Como consegiiência de Sn — nun < Sn < S, Sn — NUn 
converge para um valor s < S. Excluindo a cauda de termos positivos u; — un dei = v + 1 to n, inferimos, 
por Sn — nun > Uo + (U1 — Un) +--+ (Uy — Un) = Sy — VUn QUE Sn — NUn > S, para n — oo. Por conseguinte, 
s > S, também, portanto, s = Se nun —> 0. 

Quando aplicado à série harmônica 51, + com n 
para +00. 


1 = 1, esse teorema indica que ela não converge; diverge 
Adição, Subtração de Séries 

Se temos duas série convergentes >. Un — s e >, Un — S, a soma e a diferença das duas também convergirão 
para s + S porque suas somas parciais satisfazem 


[sj A Sj (si T Si) | = sj =S E (Sj = Si) | < E = sil + IS; = Sil < 2e 


usando a desigualdade triangular 
Jal — |b] < |a + b| < |a| + |b] 


para a = sj — si, b = Sj — Si. 
Uma série convergente 5”, un — S pode ser multiplicada termo a termo por um número real a. A nova série 
convergirá a a§ porque 
las; — asi| = la(s; — si) | = |alls; — si| < lale. 


Essa multiplicação por uma constante pode ser generalizada para uma multiplicação por termos c, de uma 
sequência limitada de números. 

Se am um converge para Se0 < cn < M são limitados, então a UnCn é convergente. Se Sa um é divergente 
e cn > M > 0, então 3, uncn diverge. 

Para provar esse teorema tomamos i, j suficientemente grandes, de modo que |s; — s;| < e. Então, 


j j 
X unen < MS un = Mls;— si| < Me. 
it it 


DE unen > MS un > 00. 
n n 


Usando o teorema binomial? (Seção 5.6), podemos expandir a função (1 + x): 


O caso divergente resulta de 


t ON A, n—1 
ma THT Sg ese E) deves, (5.10) 


Se deixarmos x — 1, essa série se torna 


== detesta (5.11) 


uma série que denominamos oscilante no início desta seção. Embora ela não convirja no sentido usual, podemos 
atribuir um significado a essa série. Euler, por exemplo, atribuiu um valor de 1/2 a essa seqüência oscilante com 
base na correspondência entre essa série e a função bem definida (1 +) +. Infelizmente, tal correspondência entre 
série e função não é única e essa abordagem deve ser refinada. Foram desenvolvidos outros métodos para atribuir 
um significado a uma série divergente ou oscilante, métodos para definir uma soma. Veja G. H. Hardy, Divergent 
Séries, Chelsea Publishing Co. 2% ed. (1992). Contudo, em geral, o interesse desse aspecto das séries infinitas 
para o cientista ou engenheiro é relativamente pequeno. Uma exceção a essa afirmativa, a muito importante série 
assintótica ou semiconvergente, é considerada na Seção 5.10. 


Exercícios 
5.11 Mostre que 
£ (2n -1)(2n + 1) 2 


Sugestão: Mostre (por indução matemática) que sm = m/(2m + 1). 


3A Equação (5.10) pode ser verificada multiplicando ambos os lados por 1 + x. 
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5.1.2 Mostre que 
o 
Dmt 
e n(n +1) 


Ache a soma parcial sm e verifique se está correta por indução matemática. 
Nota: O método de expansão em frações parciais, Seção 15.8, oferece um modo alternativo para 
resolver os Exercícios 5.1.1 e 5.1.2. 


5.2 Testes de Convergência 


Embora séries não-convergentes possam ser úteis em certos casos especiais (compare com a Seção 5.10), por 
questão de conveniência, se não de necessidade, normalmente insistimos que nossas séries sejam convergentes. 
Portanto, poder dizer de antemão se uma dada série é convergente torna-se uma questão de extrema importância. 
Desenvolveremos vários testes possíveis, começando com os testes simples e relativamente insensíveis e passando 
para os testes mais complicados, porém bastante sensíveis. Por enquanto, vamos considerar uma série de termos 
positivos a, > 0, deixando os termos negativos para a seção seguinte. 


Teste de Comparação 

Se, termo a termo, uma série de termos O < Un < an, na qual os an formam uma série convergente, a série ps Un 
também é convergente. Se un < an para todos os n, então 31, un <>), an e Dm Un, portanto, é convergente. 
Se, termo a termo, uma série de termos Yn > bn, na qual os by formam uma série divergente, a série 31, Un 
também é divergente. Note que comparações de um com bn ou Un ou an não resultam em nenhuma informação. 
Se vn > bn para todos os n, então 57, Un > >, bn e, portanto, 3”, Un é divergente. 

Para a série convergente a, já temos a série geométrica, ao passo que a série harmônica servirá como a série 
divergente de comparação b,. Na medida em que outras séries são identificadas como convergente ou divergente, 
elas podem ser usadas no lugar das séries conhecidas nesse teste de comparação. Todos os testes desenvolvidos 
nesta seção são, em essência, testes de comparação. A Figura 5.1 mostra esses testes e as inter-relações. 


7 x Integral de 
Raiz de Cauchy Euler-Maclurin 


(comparação com (Comparação 
séries geométricas) com integral) 


a =nlnn 
n 


Gauss 


Figura 5.1: Testes de comparação. 


(Também por comparação 
com série geométrica) 


Exemplo 5.2.1 UMA SÉRIE DE DIRICHLET 

Teste > ,n?,p = 0,999, para convergência. Visto que n 0999 > nleb, = n~! forma a série 
harmônica divergente, o teste de comparação mostra que 57, n 9999 é divergente. Generalizando, diz-se que 
> n7? é divergente para todo p < 1 mas convergente para p > 1 (veja o Exemplo 5.2.3). 


Teste da Raiz de Cauchy 


Se (an)! n <r < 1 para todo n suficientemente grande, com r independente de n, então Es An é convergente. 
Se (an)! ” > 1 para todo n suficientemente grande, então Dai An é divergente. 
A primeira parte desse teste é verificada com facilidade elevando (a,,) 1/n < r à enésima potência. Obtemos 


An LTKT: 
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Uma vez que r” é exatamente o enésimo termo em uma série geométrica convergente, >”, am é convergente pelo 
teste de comparação. Ao contrário, se (an) n” > 1, então an > 1 ea série deve divergir. Esse teste da raiz é 
particularmente útil para estabelecer as propriedades de uma série de potências (Seção 5.7). 


Teste da Razão de D’ Alembert (ou Cauchy) 


Se an+1/an < r < 1 para todo n suficientemente grande, e r é independente de n, então Xa An É convergente. 
Se an41/G > 1 para todo n suficientemente grande, então Ds an é divergente. 

A convergência é provada por comparação direta com a série geométrica (1 +r +r? +- -- ). Na segunda parte, 
Gn+1 > an € a divergência deve ser razoavelmente óbvia. Embora não seja tão sensível quanto o teste da raiz de 
Cauchy, esse teste de razão de D’ Alembert é um dos mais fáceis de aplicar e tem ampla utilização. Um enunciado 
alternativo do teste da razão é na forma de um limite: se 


s An+1 
lim 


n=>00 An 


< 1, convergência, 


> 1, divergência, (5.12) 


= 1, indeterminada. 


Por causa dessa última possibilidade indeterminada, o teste da raiz pode falhar em pontos cruciais, e por causa 
disso são necessários testes mais delicados, mais sensíveis. O leitor atento talvez esteja imaginando por que essa 
indeterminação surgiu. Na verdade, ela estava oculta na primeira afirmação, an+1/an < r < 1. Poderíamos 
encontrar an+1/an < 1 para todo n finito mas não conseguirmos escolher um r < 1 independente de n, tal que 
An+1/Gn < r para todo n suficientemente grande. Um exemplo é dado pela série harmônica 

An+1 n 


= 1. 1 
S (5.13) 


Uma vez que 
lim ZH =1, (5.14) 


n=>00 dn 


não existe nenhuma razão fixa r < 1 e o teste da razão falha. 


Exemplo 5.2.2 TESTE DA RAZÃO DE D'ALEMBERT 
Teste 51, n/2” para convergência. 


an (n+D/2d 1 n+1 


= =. 5.15 
An n/2" 2 n ado) 
Uma vez que 
E 3 
Sp se paran > 2, (5.16) 
An 4 
temos convergência. Alternativamente, 
ñ 1 
lim AH (5.17) 
n>00 an 2 
e, novamente, convergência. n 


Teste da Integral de Cauchy (ou Maclaurin) 
Esse é outro tipo de teste de comparação, no qual comparamos uma série com uma integral. Em termos 
geométricos, comparamos a área de uma série de retângulos de largura unitária com a área sob a curva. 

Seja f(x) uma função monotônica decrescente contínua na qual f(n) = an. Então 5”, am converge se 


f ° f(x) da é finita e diverge se a integral é infinita. Para a i-ésima soma parcial 


1 
s= an=} f(n). (5.18) 
n=1 n=1 


Mas, 
i+1 
Si > / fla) da (5.19) 
1 
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So) So) Nisa, 


> x 


Figura 5.2: (a) Comparação entre integral e blocos de soma que sobram. (b) Comparação entre integral e blocos de 
soma que faltam. 


pela Figura 5.2a, sendo f(x) monotônica decrescente. Por outro lado, pela Figura 5.2b, 


s;— q < A F(a) dz, (5.20) 
1 


na qual a série é representada pelos retângulos inscritos. Considerando o limite como à — o0, temos 


f tods Ens [Prata (5.21) 
1 si 1 


Por conseguinte, a série infinita converge ou diverge à medida que a integral correspondente convergir ou divergir. 
Esse teste da integral é particularmente útil para estabelecer limites superiores e inferiores para o resto de uma 
série após a soma de um certo número de termos iniciais. Isto é, 


n=1 n=1 n 1 
onde 
oo SO oo 
Fla) da < > An < f(x) dz + ans 
N+1 n=N41 N+1 


Para livrar o teste da integral do requisito bastante restritivo de que a função interpoladora f(x) seja positiva e 
monotônica, mostramos que, para qualquer função f(x) com uma derivada contínua, 


Ny Ny Ny 
5 rws f Ho)de+ | (a — [2]) f' (£) dx (5.22) 


n=N;+1 Ni 


é válida. Aqui [x] denota a maior integral abaixo de x, portanto x — |x] varia sob a forma de dente de serra entre O 
e 1. Para derivar a Equação (5.22), observamos que 


Ny Ns 
f xf'(x)de = Nif(N A — Nif(N;) — E f(x) da, (5.23) 


usando integração por partes. Em seguida, avaliamos a integral 


Ny Ny—1 n+1 Ny-1 
fo tarado Dn Feds DD nfs- s) 
Ni n=N; Y” n=N; 
Ny 
=- XO Hm) NfN)+ NINA). (5.24) 


n=N;+1 
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Subtraindo a Equação (5.24) de (5.23) chegamos à Equação (5.22). Note que f(x) pode subir ou descer e até mudar 

de sinal, portanto a Equação (5.22) também se aplica a séries alternantes (veja a Seção 5.3). Em geral, f'(x) cai 

mais rapidamente do que f(x) para x — oo, portanto o termo do resto na Equação (5.22) converge melhor. E fácil 
ado 


melhorar a Equação (5.22) substituindo x — [x] por x — [x] — 5, que varia entre —1 e 


280 


Ns Ns 
E =f todos f (e-e Drto)do 


Ni<n<Ny Ni 
+ 5 {INPA — (ND). (5.25) 
Então a integral f'(x) fica cada vez menor, se f'(x) não mudar de sinal com muita frequência. Para uma aplicação 


desse teste da integral a uma série alternante, veja o Exemplo 5.3.1. 


Exemplo 5.2.3 FUNÇÃO ZETA DE RIEMANN 
A função zeta de Riemann é definida por 


p= nr", (5.26) 
n=1 
contanto que a série convirja. Podemos tomar f(x) = £x7?, e então 
oo gr Pt oO 
x? dr = ——| , pl 
J —p+1ļ|; 
=l]lnz |X], p=. (5.27) 


A integral e, portanto, a série, é divergente para p < 1, convergentes para p > 1. Daí, a Equação (5.26) poderia 
acarretar a condição p > 1. Por acaso, essa é uma prova independente de que a divergência da série harmônica 
(p = 1) é logarítmica. A soma do primeiro milhão de termos edad n7t é apenas 14.392 726... m 


Essa comparação por integral também pode ser usada para estabelecer um limite superior para a constante de 
Euler-Mascheroni,* definida por 


y= lim [3 mma). (5.28) 


Voltando às somas parciais, a Equação (5.20) resulta em 


x 


Sn = Sm -mns f CE ESN (5.29) 
1 


m=1 


Avaliando a integral da direita, sn, < 1 para todo n e, portanto, y < 1. O Exercício 5.2.12 leva a limites mais 
restritivos. Na verdade, a constante de Euler-Mascheroni é 0, 57721566... 


Teste de Kummer 

Esse é o primeiro dos três testes que são um pouco mais difíceis de aplicar do que os precedentes. Sua importância 
está em seu poder e sensibilidade. Muitas vezes, pelo menos um dos três funcionará quando os testes mais simples, 
mais fáceis, forem inconclusivos. Contudo, é preciso lembrar que esses testes, assim como os que já discutimos, 
são, em última instância, baseados em comparações. Pode-se demonstrar que não existe a série que converge mais 
lentamente e a série que diverge mais lentamente. Isso significa que todos os testes dados aqui, incluindo o de 
Kummer, podem falhar alguma vez. 

Consideremos uma série de termos positivos u; e uma sequência de constantes positivas finitas a;. Se 


Un 


-anp > C>0 (5.30) 


An 
Un+1 


“Essa é a notação do National Bureau of Standards, Handbook of Mathematical Functions, Applied Mathematics Series-55 (AMS-55). 
Nova York: Dover (1972). 
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para todo n > N, em que N é algum número fixo, 5 então = u; converge. Se 


Un 


An 


— Qn41 L0 (5.31) 
Un+1 
e ,a;" diverge, então 52, u; diverge. 
A prova desse teste poderoso é extraordinariamente simples. Pela Equação (5.30), sendo C alguma constante 

positiva, 

Cuns1 < ANUN — AN+1UN+1 

Cu <ansu — GN +2U 
N+2 ÉS AN+1UN+1 N+2UN+2 (5.32) 


Somando e dividindo por C (e lembrando que C + 0), obtemos 


n 
ANUN AnUn 
o a rs (5.33) 
1=N+41 
Por conseguinte, para a soma parcial sn, 
E ayu AnU 
NUN n Un 
RES a A 
A C C 
a ayu 
< 5 ui + z M , uma constante, independente de n. (5.34) 


Portanto, as somas parciais têm um limite superior. Sendo zero um limite inferior óbvio, a série X` u; deve 
convergir. 
A divergência é mostrada como segue. Pela Equação (5.31) para un+ı > 0, 


AnUn 2 An—1Un-1 2 2 aNUN, Nn > N. (5.35) 
Assim, para an > 0, 
ayu 
ie as SNN (5.36) 
An 
e 
(0,6) (6,0) 
5 u; > aNun 5 üz (5.37) 
i=N+1 i=N+1 


Se DDR ayt divergir, então, pelo teste de comparação, X; u; diverge. As Equações (5.30) e (5.31) costumam ser 
dadas em forma de limite: 


lim (on Sho ansa) =C. (5.38) 


N00. Un+1 


Assim, para C > 0 temos convergência, ao passo que, para C < O (e 55, az‘ divergente), temos divergência. 
Talvez seja útil mostrar a estreita relação entre a Equação (5.38) e as Equações (5.30) e (5.31) e mostrar por que a 
indeterminância se insinua quando o limite C = 0. Pela definição de limite, 


Un 
An 


E ati cl <e (5.39) 


Un+1 
para todo n > N e todo £ > 0, não importando quão pequeno seja £. Retirando-se os sinais de valor absoluto, 


Un 


C—E<an — am LC +E. (5.40) 


Un+1 
Agora, se C > 0, a Equação (5.30) resulta de £ suficientemente pequeno. Por outro lado, se C < 0, Equação (5.31), 
resulta a Equação (5.31). Contudo, se C = 0, o termo central, an (Un /Un+1) — Gn+1, pode ser positivo ou negativo e 
a prova falha. A utilização primária do teste de Kummer é para provar outros testes, tal como o de Raabe (compare 
também com o Exercício 5.2.3). 
Se escolhermos as constantes positivas a, do teste de Kummer, tais que a, = n, temos o teste de Raabe. 


SCom um finito, a soma parcial s y sempre será finita para N finito. A convergência ou divergência de uma série depende do comportamento 
da última infinidade de termos e não dos primeiros N termos. 
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Teste de Raabe 
Se un > 0 ese 
a( eds 1)=P>1, (5.41) 
Un+1 


para todo n > N, em que N é um inteiro positivo independente de n, então 5", u; converge. Aqui, P = C + 1 
do teste de Kummer. Se 


a Saa 1) <1, (5.42) 
Un+1 
então >, u; diverge (como >), n~t diverge). A forma do limite do teste de Raabe é 
. Un 
lim a — 1) aR (5.43) 
n— o0 Un+1 


Temos convergência para P > 1, divergência para P < 1 e nenhuma conclusão para P = 1, exatamente como 
no teste de Kummer. Essa indeterminância é apontada pelo Exercício 5.2.4, que apresenta uma série convergente e 
uma série divergente, sendo que ambas resultam em P = 1 na Equação (5.43). 

O teste de Raabe é mais sensível do que o teste da razão de d' Alembert (Exercício 5.2.3) porque ço, no 
diverge mais lentamente do que oc 1. Obtemos um teste mais sensível (e que ainda é razoavelmente fácil de 
aplicar) escolhendo a, = n ln n. Esse é o teste de Gauss. 


1 


Teste de Gauss 


Se un > O para todo n e 
Un 


(5.44) 


h 
=1+-+ 
Un+1 n 
na qual B(n) é uma função limitada de n para n — oo, então 3”, u; converge para h > 1 e diverge para h < 1: 
aqui não há nenhum caso indeterminado. 
O teste de Gauss é um teste de convergência de série extremamente sensível e funcionará para todas as séries 
que o físico provavelmente encontrará. Para h > 1 ou h < 1, a prova resulta diretamente do teste de Raabe: 


h B B 
lim n[1+ Lp w = ] = lim [a+ 2m] =h. (5.45) 
n= n n n—>00 n 
Se h = 1, o teste de Raabe falha. Contudo, se voltarmos ao teste de Kummer e usarmos a, = nlnn, a 


Equação (5.38) leva a 


. 1 B(n) 

im fnmn|1 +4 mê [nina +) 

= lim [amn H - (ut inn + 1] 

= lim @+Dfan-mn-m(1+ 5) (5.46) 


Tomando emprestado um resultado da Seção 5.6 (que não é dependente do teste de Gauss), temos 


: 1 . 1 1 1 
dim (0 +)(1+5) = lim (n4 1E T Foa =) 
=-1<0. (5.47) 


Por conseguinte, temos divergência para h = 1. Esse é um exemplo de uma aplicação bem-sucedida do teste de 
Kummer quando da falha do teste de Raabe. 


Exemplo 5.2.4 SÉRIE DE LEGENDRE 
A relação de recorrência para a solução de série da equação de Legendre (Exercício 9.5.5) pode ser posta na forma 
azj+2  2j(2j +1)—I(L+1) 


= i 5.48 
do; OFITI aR 
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Para uj = az; e B(j) = O(1/j2) — 0 (isto é, |B(j)j2| < C, C > 0, uma constante) quando j — oo no teste de 
Gauss aplicamos a Equação (5.45). Então, para j > 1, 
2j + 1)(2j + 2 2j +2 1 
Uj PDR ad (5.49) 
Uj+i 2j(2j +1) 2j J 


Pela Equação (5.44), a série é divergente. 


Melhoria da Convergência 
Até aqui esta seção preocupou-se em estabelecer convergência como uma propriedade matemática abstrata. Na 
prática, a taxa de convergência pode ser de considerável importância. Aqui apresentamos um método para melhorar 
a taxa de convergência de uma série convergente. Outras técnicas são dadas nas Seções 5.4 e 5.9. 

O princípio básico desse método, devido a Kummer, é formar uma combinação linear de nossa série de 
convergência lenta e uma ou mais séries cuja soma é conhecida. Para as séries conhecidas, a coleção 


— 1 1 
= ansD nro ra 


é de particular utilidade.” As séries são combinadas termo a termo e os coeficientes na combinação linear são 
escolhidos para cancelar os termos de convergência mais lenta. 


Exemplo 5.2.5 FUNÇÃO ZETA DE RIEMANN, ((3) 


Seja a série a ser somada 57, n~’. Na Seção 5.9 ela é identificada como função zeta de Riemann, ((3). 


Formamos uma combinação linear 


a não é incluída, visto que converge mais lentamente do que $(3). Combinando termos, obtemos do lado esquerdo, 


a ff1ı az nl+ra)+3n+2 
Hat) nnt nr) | 


n=1 
Se escolhermos a, = —1, as equações precedentes resultam em 
< 1 O 3n+2 
3) = dio 5.50 
(8) 2; aa T fe) 


4 


A série resultante pode não ser bonita, mas converge como n74 o mais rapidamente do que n” 2. Uma forma mais 
5 
E 


conveniente vem do Exercício 5.2.21. Nesse exercício, a simetria leva à convergência como nº. 
O método pode ser estendido, incluindo az as para obter convergência como n” 2, a4@4 para obter convergência 
como nº, e assim por diante. Em certo momento, você acabará chegando a um meio-termo entre quanta álgebra 


faz e quanta aritmética o computador faz. Como os computadores são mais rápidos, o equilíbrio está pendendo 
firmemente para menos álgebra para você e mais aritmética para ele. 


6A dependência l entra em B(j) mas não afeta h na Equação (5.45). 
7Essas somas de séries podem ser verificadas expandindo as formas por frações parciais, escrevendo os termos iniciais e examinando o 
padrão de cancelamento de termos positivos e negativos. 


“livro” — 2007/81 — 15:06 — page 255 — #265 


ELSEVIER 5. SÉRIES INFINITAS 255 
Exercícios 
5.21 (a) Prove que, se 
lim nPu, = A < œ, p>1l, 
n—00 


24 OO 
a série 37,1 Un converge. 
(b) Prove que, se 
lim nu, = A > 0, 
n—00 


a série diverge. (O teste falha para 4 = 0.) 
Esses dois testes, conhecidos como testes de limites, costumam ser convenientes para estabelecer a 
convergência de uma série. Eles podem ser tratados como testes de comparação, comparando com 


Sm, I<q<p. 


é uma constante com 0 < K < oo, mostre que 5” bn converge ou diverge com J- an. 
Sugestão: Se >” an convergir, use bl, = 5% On Se 55, an divergir, use bj; = Eb. 

5.2.3 Mostre que o teste completo da razão de d' Alembert resulta diretamente do teste de Kummer com 
Qi = 1. 


5.2.4 Mostre que o teste de Raabe é inconclusivo para P = 1, estabelecendo que P = 1 para as séries 


(a) un = e que esta série diverge. 


nlan 


(b) un = z € que esta série converge. 


1 
n(lnn) 
Nota: Por adição direta, 5)" [n(n n)?] 7} = 2,02288. O resto da série n > 10º resulta em 
0,08686 pelo teste de comparação da integral. Então, o total, 2 para oo, é 2,1097. 


5.2.5 Muitas vezes, o teste de Gauss é dado na forma de um teste da razão 


Un n? + an + ao 


Un+1 n? + bin É é bo É 


Para quais valores dos parâmetros a; e bı há convergência? Divergência”? 


Resposta: Convergente para a, — bı > 1, 
divergente para a, — bı < 1. 


5.2.6 Teste para convergência 
Es -1/2 
(a) > (nn)! (95 [n(n + 1] 
n=2 n=1 
(b) se n (e) $ al 
rop i en 2n +1 
< 1 
(e) 2 mOn + 1) 
5.2.7 Teste para convergência 
a < 1 
—— d In[1+ — 
oba OE 
(b) D bu (e) so o 
e nlan neta 


El 
O qa 


“livro” — 2007/8/1 — 15:06 — page 256 — #266 


256 Física Matemática Arfken e Weber ELSEVIER 
5.2.8 Para quais valores de p e q a seguinte série convergirá? >. ETR 
; f p>1, todoq, ; p<1, todog, 
Resposta: Convergente: para ( pel ad (aivergeme para p=i, qzl. 
5.2.9 Determine a faixa de convergência para a série hipergeométrica de Gauss 
aß a(a + DB(B+1) > 
F(a,8,y;x)= 1 + x + q“ +. 
(a, 8,7;2) 1% 2»(1+1) 
Sugestão: Gauss desenvolveu seu teste para a finalidade específica de estabelecer a convergência 
dessa série. 
Resposta: Convergente para —1 < x < 1e x = +1 se y >a +. 
5.2.10 Uma calculadora de bolso dá o resultado 
100 
>;nº=1,202007. 
Mostre que 
1,202056 < > nº < 1, 202 057. 
n=1 
Sugestão: Use integrais para determinar os limites superior e inferior para qm n’ 
Nota: Um valor mais exato para a soma de ¢(3) = $7; n~? é 1,202 056 903... ; sabe-se que 
Ç(3) é um número irracional, mas não está ligado a constantes conhecidas como e, 7, y, ln 2. 
5.2.11 Estabeleça os limites inferiores para pa 000000 p—1 admitindo que 
(a) a constante de Euler-Mascheroni é conhecida. 
1,000,000 
Resposta: 14,392726< XO mn! < 14,392 727. 
n=l 
(b) a constante de Euler-Mascheroni é desconhecida. 
5.2.12 Dado o n7! = 7,485 470... estabeleça limites superior e inferior para a constante de Euler- 
Mascheroni. 
Resposta: 0,5767 < y < 0, 5778. 
5.2.13 (Do paradoxo de Olbers.) Admita um universo estático no qual as estrelas estão uniformemente 
distribuídas. Divida todo o espaço em cascas de espessura constante; as estrelas que estão em 
qualquer uma das cascas subtendem, por si sós, um ângulo sólido de wo. Levando em conta o 
bloqueio de estrelas distantes por estrelas mais próximas, mostre que o ângulo sólido líquido 
total subtendido por todas as estrelas, com as cascas estendendo-se ao infinito, é exatamente 
47. [Portanto, o céu noturno deveria estar flamejante de luz. Se quiser mais detalhes, consulte 
E. Harrison, Darkness at Night: A Riddle of the Universe. Cambridge, MA: Harvard University 
Press (1987).] 
5.2.14 Teste para convergência 
2 [1-3-5 (2n=1)]? 1 9 2% 
3 = + + H 
4l 2-4-6. “-(2n) 4" 6 256 
5.2.15 A série de Legendre 5º j par Uj (x) satisfaz as relações de recorrência 


(j + 1)(j +2) E UI + ni) 
(J +2) +3) ida 


uj+2(£) = 


nas quais o índice j é par e | é alguma constante (porém, neste problema, não um inteiro ímpar 
não-negativo). Ache a faixa de valores de x para a qual essa série de Legendre é convergente. Teste 
as extremidades. 


ELSEVIER 
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5.2.16 


5.2.17 


5.2.18 


5.2.19 


5.2.20 


5.2.21 


Resposta: —1 < x < 1. 


Uma solução de série (Seção 9.5) da equação de Chebyshev leva a termos sucessivos que têm a 
razão 


uj+a(£) (k +)? -n E 
) b) 


uj(x) (k+ġi+1)(k+j+2 


com k = 0 e k = 1. Teste para convergência em x = +1. 
Resposta: Convergente. 


Uma solução de série para a função ultra-esférica (Gegenbauer) C'S (x) leva à recorrência 


(k+ )(k+j +20) — n(n +20) 
(k+I+N(k+j+2) 


aj+2 = üj 


Investigue a convergência de cada uma dessas séries em x = +1 como uma função do parâmetro a. 


Resposta: Convergente para a < 1, 
divergente para a > 1. 


Uma expansão de série da função beta incompleta (Seção 8.4) resulta em 


Dado que 0 < x < 1,p > 0 eq > 0, teste essa série para convergência. O que acontece em x = 1? 


Mostre que a seguinte série é convergente. 


OO 


(2s — 1)!! 
>, (2s)!!(2s + 1) 


Nota: (2s — Dl! = (2s — 1)(2s — 3)---3- 1 com (—1)!! = 1; (25)! = (2s)(2s — 2) -..4.2 
com 0!! = 1. A série aparece como uma expansão de série de sen !(1) e igual a 7/2, e 
sen“!y = arcsen x Æ (sen x) 1. 


Mostre como combinar ((2) = X; n7? 


—4 
TE 
Nota: Ç(2) é conhecida: ((2) = 7?/6 (veja a Seção 5.9). 


com a € as para obter uma série que converge como 


A melhoria de convergência do Exemplo 5.2.5 pode ser executada com mais desembaraço (nesse 
caso especial) colocando a» em uma forma mais simétrica: substituindo n by n — 1, temos 


, Š 1 il 
VD SO ZF 


n=2 
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(a) Combine ¢(3) e a% para obter convergência como n >. 


(b) Deixe que aí, seja a4 com n — n — 2. Combine (3), 04, e a4 para obter convergência como 
no. 
(c) Se 6(3) deve ser calculada com precisão até a sexta casa decimal (erro 5 x 1077), quantos termos 


são requeridos só para ((3)? Combinados como na parte (a)? Combinados como na parte (b)? 
Nota: O erro pode ser estimado utilizando a integral correspondente. 

5 o 1 

R ta: 3) = ; 

esposta: (a) ¢(3) A EST 


5.2.22 A constante de Catalan (5(2) de M. Abramowitz e I. A. Stegun, Handbook of Mathematical 
Functions with Formulas, Graphs, and Mathematical Tables (AMS-55), Wash, D. C. National 
Bureau of Standards (1972); nova tiragem Dover (1974), Capítulo 23) é definida por 


b2) =5 (Dk + 1)? = RS 


2 1 1 1 
k=0 


Calcule 8(2) com seis dígitos de precisão. 
Sugestão: A taxa de convergência é realçada formando pares dos termos: 


16k 


(4k — 1)? — (4k + 1)? = COREE 


A 2 . 2. 2 2 , 

Se você usou dígitos suficientes em sua soma de série, >, cy <p 16k/(16kº — 1)?, números 
significativos adicionais podem ser obtidos estabelecendo limites superiores e inferiores na cauda 
da série, Sp w +1: Esses limites podem ser estabelecidos por comparação com integrais, como no 
teste da integral de Maclaurin. 


Resposta: 5(2) = 0,9159 6559 4177... 


5.3 Séries Alternantes 


Na Seção 5.2 nos limitamos às séries de termos positivos. Agora, ao contrário, consideraremos séries infinitas 
nas quais os sinais se alternam. O cancelamento parcial devido aos sinais alternantes torna a convergência mais 
rápida e mais fácil de identificar. Provaremos o critério de Leibniz, uma condição geral para a convergência de uma 
série alternante. Para séries com trocas de sinais mais irregulares, como a série de Fourier do Capítulo 14 (veja o 
Exemplo 5.3.1), o teste da integral da Equação (5.25) costuma ser útil. 


Critério de Leibniz 


Considere a série >> 4(—1)"*a, com an > 0. Se a, é monotonicamente decrescente (para n suficientemente 
grande) e lim, 00 an = 0, então a série converge. Para provar esse teorema, examinamos as somas parciais 


S2n = Q1 —az+az—: — an; (5.51) 
S2n+2 = S2n + (A2n+1 — Gon42). 
Uma vez que a2,+1 > 42n+2, temos 
S2n+2 > S2n- (5.52) 
Por outro lado, 
S2n+2 = Q1 (az a3) (a4 as) vt — A2n42- (5.53) 
Daí, sendo cada par de termos a2, — @2p+1 > 0, 
Son+2 < Q1. (5.54) 


Com as somas parciais pares limitadas Sən < Son+2 < aj e OS termos a, decrescendo monotonicamente e se 
aproximando de zero, essa série alternante converge. 

Mais um resultado importante pode ser extraído das somas parciais da mesma série alternante. Pela diferença 
entre o limite da série S e a soma parcial sn, 


S — sa = Qn41 — Gn+2 + An+43 — ny4 + ee 


= Qn41 (an+2 An+3) (an+4 An+5) Pera (5.55) 
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ou 
S— Sn < Qual (5.56) 


A Equação (5.56) diz que o erro na eliminação de uma série alternante cujos termos são monotonicamente 
decrescentes após n termos é menor do que a,,.,1, sendo o primeiro termo descartado. Conhecer o erro obtido 
desse modo pode ser de grande importância prática. 


Convergência Absoluta 


Dada uma série de termos wu, na qual o sinal de un pode variar, se >: |un| converge, então diz-se que X` un é 
absolutamente convergente. Se X` un converge, mas >” |un | diverge, a convergência é denominada condicional. 
A série harmônica alternante é um exemplo simples dessa convergência condicional. Temos 


e A GOGE i —1)”-1 
Dee dar E ea (5.57) 
n=1 


convergente pelo critério de Leibniz; mas, nas Seções 5.1 e 5.2, mostramos que 


Rs frei 
& 2 3 4 n 


é divergente. 
Note que a maioria dos testes desenvolvidos na Seção 5.2 supõe uma série positiva de termos. Portanto, esses 
testes daquela seção garantem convergência absoluta. 


Exemplo 5.3.1 SÉRIE COM TROCA IRREGULAR DE SINAIS 
Para0 < x < 27, a série de Fourier (veja o Capítulo 14.1) 


y U EN (2sen 5) (5.58) 
n 2 


n=1 


converge, tendo coeficientes que mudam de sinal com fregiiência, mas não tanta que o critério de convergência 
de Leibniz se aplique com facilidade. Vamos aplicar o teste da integral da Equação (5.22). Usando integração por 
partes, vemos imediatamente que 


oO (9,0) OO 
cos(nx sen(na 1 sen(na 
O o a 
1 n ng Ji z Jn=1 
converge, e a integral do lado direito até converge absolutamente. O termo derivativo na Equação (5.22) tem a 
forma X 

ï cos(nx 

/ (n — [n]) f- Zsen(na) — Ge | dn, 
1 n N 

em que o segundo termo converge absolutamente e não precisa mais ser considerado. Em seguida observamos que 


N Joris N ses 
g(N) = fi (n — [n])sen(nx) dn é limitada para N — oo, exatamente como f~ sen(na:) dn é limitada por causa 
da natureza periódica de sen(nx) e de sua troca regular de sinais. Usando novamente integração por partes, 


S a= Eai +f Can, 


vemos que o segundo termo é absolutamente convergente e que o primeiro vai a zero no limite superior. Por 
conseguinte, a série na Equação (5.58) converge, o que é difícil de ver por outros testes de convergência. 

Alternativamente, podemos aplicar o caso q = 1 da fórmula de integração de Euler-Maclaurin na Equação 
(5.168b), 


n 


Dros [rod + tm + E-O) 


v=1 


o que é direto, porém mais tedioso por causa da derivada de segunda ordem. 
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Exercícios 
5.3.1 (a) Pelo problema eletrostático de dois hemisférios (Exercício 12.3.20), obtemos a série 
> (2s — 1)! 
—I)(4 3)>—+—. 
2 J (s + rasa 


Teste a série para convergência. 
(b) A série correspondente para a densidade superficial de carga de superfície é 


z g (2s — 1)! 
XC(-1) (4s + Da 
s=0 

Teste a série para convergência. 
A notação !! é explicada na Seção 8.1 e do Exercício 5.2.19. 


5.3.2 Mostre por cálculo numérico direto que a soma dos primeiros 10 termos de 
: E = “qn-l,—1 
aa Din 


difere de In 2 por menos do que o undécimo termo: ln 2 = 0, 69314 71806 .... 


5.3.3 No Exercício 5.2.9 mostra-se que a série hipergeométrica é convergente para x = +1, se y > 
a + b. Mostre que há uma convergência condicional para x = —1 para y até y > a + 8-1. 
Sugestão: O comportamento assintótico da função fatorial é dado pela série de Stirling, Seção 8.3. 


5.4 Álgebra de Séries 


O estabelecimento de convergência absoluta é importante porque se pode provar que séries absolutamente 

convergentes podem ser reordenadas de acordo com as regras familiares da álgebra ou da aritmética. 

e Se uma série é absolutamente convergente, a soma da série é independente da ordem em que os termos são 
somados. 

e A série pode ser multiplicada por uma outra série absolutamente convergente. O limite do produto será o produto 
dos limites das séries individuais. A série produto, uma série dupla, também convergirá absolutamente. 


Nenhuma dessas garantias pode ser dada para séries condicionalmente convergentes. Considere, mais uma vez, 
a série harmônica alternante. Se escrevermos 


l-}+4-}t m1- (G-A 


(1—)-, (5.59) 
fica claro que a soma 


Sra! <a. (5.60) 
n=1 


Contudo, se rearranjarmos ligeiramente os termos, podemos fazer com que a série harmônica alternante convirja 
para 5. Reagrupamos os termos da Equação (5.59), tomando 


G++- (+++ ktit) 
ec) Gea) (D+ (561) 


Tratando os termos agrupados entre parênteses como termos únicos, por conveniência, obtemos as somas parciais 


sı = 1,5333 s2 = 1,0333 
s3 = 1,5218 s4 = 1,2718 
s5 = 1,5143 S6 = 1, 3476 
S7 = 1,5103 S8 = 1,3853 
s9 = 1, 5078 s10 = 1,4078. 
Por essa tabulação de s, e pelo gráfico de sn versus n na Figura 5.3, a convergência para 3 fica razoavelmente 


clara. No rearranjo dos termos tomamos termos positivos até a soma parcial ser igual ou maior do que 3 e então 
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somamos termos negativos até que a soma parcial chegue logo abaixo de 3, e assim por diante. À medida que a 
série se estende para o infinito, todos os termos originais acabam aparecendo, mas as somas parciais dessa série 
harmônica alternante rearranjada converge para 5. 

Mediante um rearranjo adequado de termos, podemos fazer com que uma série condicionalmente convergente 
convirja para qualquer valor desejado e até mesmo divirja. Essa afirmação às vezes é denominada teorema de 


Riemann. Portanto, é óbvio que a série convergente deve ser tratada com cautela. 


[SE TS, 


.500 


.400} 


-300 H 


Soma parcial, Sn 


.200 - 


f | I | 1 | | fi I 
OU De ido ARES 64 es SEG Daio, 


Números de termos na soma 


Figura 5.3: Série harmônica alternante — termos rearranjados para dar convergência para 1,5. 


Séries absolutamente convergentes podem ser multiplicadas sem problemas. Isso resulta como um caso 
especial do rearranjo de um série dupla. Todavia, séries condicionalmente convergentes nem sempre podem ser 
multiplicadas para resultar em séries convergentes, como mostra o exemplo a seguir. 


Exemplo 5.4.1 O QUADRADO DE UMA SÉRIE CONDICIONALMENTE CONVERGENTE PODE 


DIVERGIR 


n—l 
A série ea ci converge, pelo critério de Leibniz. O termo geral de seu quadrado, entre colchetes, 


(a n| t 1 1 1 o$ £ 
p vn | Ra) ata! teta] 


consiste em n — 1 termos aditivos, cada qual maior do que FAT: portanto o termo produto entre colchetes é 


maior do que ”— e não vai a zero. Daí, esse produto oscila e, portanto, diverge. 
n—l 
Por isso, para que um produto de duas séries convirja, temos de impor, como uma condição suficiente, que 
ao menos uma delas convirja absolutamente. Para provar esse teorema da convergência do produto, ou seja, se 


35, Un converge absolutamente para U, 5, vn converge para V, então 


n 
X Cn, Cn = X UmUn-m 
n 


m=0 


converge para UV, é suficiente mostrar que os termos da diferença Dn = Co + c1 +--+ + con — Un Vn — O para 
n — œ, em que Un, Vn são as somas parciais de nossa série. O resultado é que as diferenças das somas parciais 


D, = ugvo + (uov + uvo) +: + (uguan + U1Von—1 +*+: + Uznvo) 
—(uotua+ o +Hunvo tv + +un) 
= ug(Un41 +: + van) + U1 (Unpi + + Van) e: E Uni Unad 


+ Unsa(vo ++ Un-1) + eee Unto, 
portanto, para todo n suficientemente grande, 


[Dal < e(Juol +-+- + |un-al) + M (Junpa] +--+ |uzn|) < e(a + M), 
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porque |un+1 + Vn+2 +- + Vn+m| < € para n suficientemente grande e todos os inteiros positivos m, já que 
> vn converge, e as somas parciais V, < B de >), vn são limitadas por M, porque a soma converge. Por fim, 
chamamos 3” |un| = a, já que 5” un converge absolutamente. 

Duas séries podem ser multiplicadas, contanto que uma delas convirja absolutamente. Adição e subtração de 
séries termo a termo também são válidas se uma série convergir absolutamente. 


Melhoria da Convergência, Aproximações Racionais 
A série = 


In(1 = pe- 1<8<1 6l 
n(1 +2) = X (-1) > <x<1, (5.61a) 


n=1 


converge muito lentamente à medida que x se aproxima de +1. A taxa de convergência pode ser melhorada 
substancialmente multiplicando ambos os lados da Equação (5.61a) por um polinômio e ajustando os coeficientes 
do polinômio de modo a cancelar as porções da série que convergem com mais lentidão. Considere a possibilidade 
mais simples: multiplique In(1 + x) by 1 Haja: 
o n—l r” — n=l pen 
(1+ ax)ln(1 + x) = 2 ~ta 21) T~ 


Combinando termo a termo as duas séries à direita, obtemos 


atas) +a) =+ D E - RE je 


II 
8 
| 
Má 
= 
3 
I 
= 
3 
PE 
a 
| 
o 
É 
| 
= 
3 


É claro que, se considerarmos a, = 1, o n no numerador desaparece e nossa série combinada converge como n” 2. 


Continuando esse processo, constatamos que (1 + 2x + x?) In(1 + x) se anula como n~? e que (1 + 3x + 
3x? + x?) In(1 + x) se anula como n”4. Na verdade, estamos passando de uma simples expansão de série da 
Equação (5.6la) para uma representação fracionária racional na qual a função In(1 + x) é representada pela razão 
entre uma série e um polinômio: 


x+ Dnma(= Da” /In(n — 1)] 
l+x $ 


ln(1 + x) = 
Essas aproximações racionais podem ser compactas, bem como precisas. 


Rearranjo de Série Dupla 
Um outro aspecto do rearranjo de uma série aparece no tratamento de série dupla (Figura 5.4): 


oo 0 

J J anm- 

m=0 n=0 
Vamos substituir 


n=q>0, m=p-q>0 (q<p). 


Isso resulta na identidade 


oo œ o p 
o 3 an, m = 5 5 aq, p-q- (5.62) 


m=0 n=0 p=0 q=0 
A soma sobre p e q da Equação (5.62) é ilustrada na Figura 5.5. A substituição 


leva a 


2 S anm =Y S Opi (5.63) 
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| aio 4i] 2 
2 Lo Mi 
3 azp 


Figura 5.5: Série dupla — novamente, a primeira soma é representada por linhas verticais pontilhadas, mas essas 
linhas correspondem às diagonais na Figura 5.4. 


com |[r/2] = r/2 para r par e (r — 1)/2 para r ímpar. A soma sobre r e s da Equação (5.63) é mostrada na 
Figura 5.6. As Equações (5.62) e (5.63) são claramente rearranjos do conjunto de coeficientes anm, rearranjos que 
são válidos contanto que tenhamos convergência absoluta. 

A combinação das Equações (5.62) e (5.63), 


œo p oo [r/2] 
a 5 Ag,p-q — se Qs r—2s, (5.64) 
p=0 q=0 r=0 s=0 


é usada na Seção 12.1 na determinação da forma de série dos polinômios de Legendre. 


r=0 1 2 3 4 
s=0| a% Ag do So lo 
1 di ay ay 
2 da 


Figura 5.6: Série dupla — A soma sobre s corresponde a uma soma ao longo das linhas pontilhadas quase 
horizontais na Figura 5.4. 


“livro” — 2007/8/1 — 15:06 — page 264 — #274 


264 Física Matemática Arfken e Weber ELSEVIER 


Exercícios 
5.41 Dada a série (derivada na Seção 5.6) 


2 3 4 
n(lto)=2- +51" —I<a<l, 
mostre que 
: o pad EE a I<z<l 
TES EA ug Er 


2 


A série original, In(1 + x), aparece na análise da energia de ligação em cristais. Ela é 5 da 
constante de Madelung (21n 2) para uma cadeia de átomos. A segunda série é útil para normalizar 
os polinômios de Legendre (Seção 12.3) e para desenvolver uma segunda solução para a equação 
diferencial de Legendre (Seção 12.10). 


5.4.2 Determine os valores dos coeficientes a1, az e az que farão (1 + ax + azz? + agr) In(1 + x) 
convergir como n74. Ache a série resultante. 
5.4.3 Mostre que 


n=2 
em que 6(n) é a função zeta de Riemann. 


5.4.4 Escreva um programa para rearranjar os termos da série harmônica alternante e fazer com que a 
série convirja para 1,5. Agrupe seus termos como indicado na Equação (5.61). Liste as primeiras 
100 somas parciais sucessivas e passe um pouco de 1,5 ou fique um pouco abaixo de 1,5 e liste os 
novos termos incluídos em cada soma parcial. 

polo Eos Mede MM Ac. S 

Sn | 1,5333 | 1,0333 | 1,5218 | 1,2718 | 1,5143 


Resposta: 


5.5 Série de Funções 


Estendemos nosso conceito de série infinita para incluir a possibilidade de que cada termo u» pode ser uma função 
de alguma variável, um = Un (x). Numerosas ilustrações de tal série de funções aparecem nos Capítulos 11-14. As 
somas parciais tornam-se funções da variável x, 


Sn(x) = un(x) + us(x) + +Huna), (5.65) 


bem como a soma da série, definida como o limite das somas parciais: 


X un(£) = S(2)= lim sa(z). (5.66) 


n—>o 


Até aqui nos preocupamos com o comportamento das somas parciais como uma função de n. Agora consideramos 
como as quantidades precedentes dependem de x. Aqui, o conceito fundamental é o da convergência uniforme. 


Convergência Uniforme 
Se, para qualquer pequeno £ > 0, existir um número N independente de x no intervalo [a, b] (isto é, a < x < b), 
tal que 

|S(x) — sn(£)| < e, para todo n >N, (5.67) 


então diz-se que a série é uniformemente convergente no intervalo [a,b]. Isso significa que, para nossa série 
ser uniformemente convergente, deve ser possível encontrar um N finito, tal que a cauda da série infinita, 
[> n«1 Ui(2º)|, seja menor do que um e arbitrariamente pequeno para todo x no intervalo dado. 

Essa condição, Equação (5.67), que define convergência uniforme, é ilustrada na Figura 5.7. A questão é que 
não importa quão pequeno presurmirmos que o £ seja, sempre podemos escolher n grande o bastante, de modo 
que a grandeza absoluta da diferença entre S(x) e sn(x) seja menor do que € para todo x, a < x < b. Se isso não 
puder ser feito, então X` un (x) não é uniformemente convergente em [a, b]. 
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Exemplo 5.5.1 CONVERGÊNCIA NÃO-UNIFORME 


oo oo r 
Un(x) = ? 5.68 
2 (a) D ar at es (op) 
So) +E 
S(x) 
S()-E 
3 
3 
nan 
r=a x=b ii 
Figura 5.7: Convergência uniforme. 
A soma parcial s,(x) = na(na + 1)! pode ser verificada por indução matemática. Por inspeção, essa 


expressão para sn (1) é válida para n = 1,2. Admitimos que ela seja válida para n termos e então provamos que é 
válida para n + 1 termos: 


Sn41(2) = Snl ) a [na o 1][(n + Da a 1] 
“na+1] | [nx + 1][(n + Dx +1] 
se WTA 
o (n+ Dar +1’ 


concluindo a prova. 
Deixando que n se aproxime do infinito, obtemos 


n—00 
S(x £ 0) = lim sa(x £0) = 
n—00 
Temos uma descontinuidade no limite de nossa série em x = 0. Todavia, sn (x) é uma função contínua de 


z,0 < x < 1, para todo n finito. Não importa quão pequeno £ possa ser, a Equação (5.67) será violada para 
todo x suficientemente pequeno. Nossa série não converge uniformemente. pa 


Teste M (Majorante) de Weierstrass 
O teste mais comumente encontrado para convergência uniforme é o teste M de Weierstrass. Se pudermos construir 
uma série de números 57º M;, na qual M; > |u;(a:)| para todo x no intervalo [a, b] e 17º M; é convergente, nossa 
série u;(x) será uniformemente convergente em [a, b]. 

A prova desse teste M de Weierstrass é direta e simples. Visto que 57, M; converge, existe algum número N, 
tal que, paran + 1 > N, 


XO Mi<e. (5.69) 
i=n+1 


Isso resulta de nossa definição de convergência. Então, com |u;(x)| < M; para todo x no intervalo aa < x < b, 


XO lu(o)|<e. (5.70) 
i=n+1 
Portanto, 
|[S(x) — sn(m))=| XO wlm)|<e, (5.71) 
i=n+1 


e, por definição, > 7º, u; (x) é uniformemente convergente em [a, b]. Uma vez que especificamos valores absolutos 
no enunciado do teste M de Weierstrass, a série >), u;(x) também é considerada absolutamente convergente. 
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Note que convergência uniforme e convergência absoluta são propriedades independentes. Nenhuma implica a 
outra. Como exemplos específicos, 


0 | n 
5. ua -00 < T < 0, (5.72) 
ntar 
e 
Yep =n(1+2) O0<s<1, (5.73) 
n 
n=1 


convergem uniformemente nos intervalos indicados mas não convergem absolutamente. Por outro lado, 


Xo (=ar =i DEsai 
n=0 


Ss med; (5.74) 


converge absolutamente mas não converge uniformemente em [0, 1]. 
Pela definição de convergência uniforme podemos mostrar que qualquer série 


f) =X un(a) (5.75) 


não pode convergir uniformemente em qualquer intervalo que inclua uma descontinuidade de f(x) se todos, un (£) 
são contínuos. 

Visto que o teste M de Weierstrass estabelece as duas, a convergência uniforme e a convergência absoluta, ele 
necessariamente falhará para séries que são uniformemente convergentes, porém condicionalmente. 


Teste de Abel 


Um teste um tanto mais delicado para a convergência uniforme foi dado por Abel. Se 


un(£) = an fala), 
5 an = À, convergente 
e as funções fn(x) são monotônicas |fn+1ı(x) < fn(x)] e limitadas, O0 < f(x) < M, para todo x em [a, b], então 
Xn Un(x) converge uniformemente em [a, b]. 
Esse teste é de particular utilidade na análise da série de potências (compare com a Seção 5.7). Detalhes da prova 


do teste de Abel e de outros testes para convergência uniforme são dados nas Leituras Adicionais apresentadas ao 
final deste capítulo. 


Séries uniformemente convergentes têm três propriedades de particular utilidade. 
1. Se os termos individuais un (x) são contínuos, a soma da série 


Fæ) = 5 ule) (5.76) 


também é continua. 
2. Se os termos individuais u, (x) são contínuos, a série pode ser integrada termo a termo. A soma das integrais 


é igual à integral da 
b O pb 
/ f(x) de = > / un(a) dz. (5.17) 
a n=1 a 


3. A derivada da soma da série f(x) é igual à soma das derivadas dos termos individuais: 


d o 
gio = > gee), (5.78) 
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contanto que sejam satisfeitas as seguintes condições: 


dun(x) 

ra dx 
A integração termo a termo de uma série uniformemente convergente? requer apenas continuidade dos termos 
individuais. Essa condição é quase sempre satisfeita em aplicações físicas. A diferenciação termo a termo de 
uma série muitas vezes não é válida porque as condições que devem ser satisfeitas são mais restritivas. De 
fato, encontraremos séries de Fourier no Capítulo 14, nas quais a diferenciação termo a termo de uma série 


uniformemente convergente leva a uma série divergente. 


são contínuas em [a, b]. 


é uniformemente convergente em |a, b]. 


Exercícios 
5.5.1 Ache a faixa de convergência uniforme da série de Dirichlet 
(a) 2 a dGa)= 2 F 
Resposta: (a) 0O<s<a<o. 
(b) I<s<a<o. 
5.5.2 Para qual faixa de a a série geométrica 57º, £” é uniformemente convergente? 


Resposta—l < -s <r <s <1. 
5.5.3 Para qual faixa de valores positivos de x é> 2 1/(1 + x”) 


(a) convergente? (b) uniformemente convergente? 


5.5.4 Se a série dos coeficientes }` an e >) bn é absolutamente convergente, mostre que a série de Fourier 
) (an cos nz + ba senna) 


é uniformemente convergente para —œ < x < 00. 


5.6 Expansão de Taylor 


Essa é uma expansão de uma função para uma série infinita de potências de uma variável x ou para uma série 
finita mais um termo de resto. Os coeficientes dos termos sucessivos da série envolvem as derivadas sucessivas da 
função. Já usamos a expansão de Taylor quando estabelecemos a interpretação física da divergência (Seção 1.7) e 
em outras seções dos Capítulos 1 e 2. Agora derivamos a expansão de Taylor. 

Admitimos que nossa função f(x) tem uma derivada contínua de enésima ordem” no intervalo aa < x < b. 
Então, integrando essa derivada enésima n vezes, 


A f (21) dr = fY (21) 


A dz2 p dzı f™ (z1) = f dz2 [ED (x2) — fE” (a)] (5.79) 
= [0 (0) — fO- (a) — (z — a) f(a). 


“= fO- (g) — f(a), 


Continuando, obtemos 


f das e das» E da f™ (x1) = fOr) = f(a) — (x — a) f? (a) 


e (x E perna). (5.80) 


SIntegração termo a termo também pode ser válida na ausência de convergência uniforme. 
92 A expansão de Taylor pode ser derivada sob condições ligeiramente menos restritivas; compare com H. Jeffreys e B. S. Jeffreys, Methods 
of Mathematical Physics, 3% ed. Cambridge: Cambridge University Press (1956), Seção 1.133. 
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Por fim, ao integrarmos pela enésima vez, 


n—1 
fP (a). (5.81) 


Note que essa expressão é exata. Nenhum termo foi descartado, nenhuma aproximação foi feita. Agora, resolvendo 
para f(x), temos 


z — qro (5.82) 
4 (a a) Rai ) + E (a a) fla) + Ra 
2! (n — 1)! 
O resto, Rn, é dado pela integral múltipla 
x T2 
R, = den: f def) (z1). (5.83) 


a a . 2. 
Esse resto, Equação (5.83), pode ser colocado em uma forma talvez mais prática usando o teorema do valor 
médio do cálculo integral: 


f g(x) dx = (x — a)g(£), (5.84) 
coma < £ < zx. Integrando n vezes, obtemos a forma lagrangiana!º do resto: 
r-a)” 
Ra = E" pg, (5.85) 


Com a expansão de Taylor nessa forma, não nos preocupamos com quaisquer questões de convergência de série 
finita. Essa série é finita, e as únicas questões referem-se à grandeza do resto. 
Quando a função f(x) é tal que 
lim Rn = 0, (5.86) 
n—> oo 


a Equação (5.82) se torna a série de Taylor: 


2 3 (2-0 ma) (5.87) 


Nossa série de Taylor especifica o valor de uma função em um ponto, x, em termos do valor da função e de suas 
derivadas em um ponto de referência a. Ela é uma expansão em potências da mudança na variável, Ar = x — a 
neste caso. A notação pode ser variada conforme a conveniência do usuário. Com a substituição de x > x + he 
a — x, temos uma forma alternativa, 


feth = EEO) 
n=0 ` 


Quando usamos o operador D = d/dz, a expansão de Taylor se torna 


fe+h =Y “o “f(a) =P fa. 
n=0 ` 


(A transição para a forma exponencial antecipa a Equação (5.90) que dela resulta.) Uma forma equivalente de 
operador dessa expansão de Taylor aparece no Exercício 4.2.4. Uma derivação da expansão de Taylor no contexto 
da teoria da variável complexa aparece na Seção 6.5. 


10Uma forma alternativa derivada por Cauchy é 


_ @- O- a) 
(n — 1)! 


Rn FOO, 


coma < Å < zx. 
lNote que 0! = 1 (compare com a Seção 8.1). 
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Teorema de Maclaurin 
Se expandirmos ao redor da origem (a = 0), a Equação (5.87) é conhecida como série de Maclaurin: 


Fa) = FO +F O) + SI) +=) E 500) (5.88) 


n=0 


Uma aplicação imediata da série de Maclaurin (ou da série de Taylor) é na expansão de várias funções 
transcendentais para séries infinitas (de potências). 


Exemplo 5.6.1 FUNÇÃO EXPONENCIAL 
Seja f(x) = e”. Diferenciando, temos 


f™ 0) =1 (5.89) 
para todo n,n = 1,2,3,.... Então, com a Equação (5.88), temos 
z=] N ay e 5.90 


Essa é a expansão de série da função exponencial. Alguns autores a usam para definir a função exponencial. 
Embora essa série seja claramente convergente para todo x, devemos verificar o termo do resto, R,. Pela 
Equação (5.85) temos 


R= SOE =e, o<kl<a. (591) 
n. n. 
Portanto, a 
Ra < (5.92) 
n: 
e 
lim R, =0 (5.93) 


para todos os valores finitos de x, o que indica que essa expansão de Maclaurin de e” converge absolutamente na 
faixa —o0 < x < 00. 


Exemplo 5.6.2 LOGARITMO 
Seja f(x) = In(1 + x). Por diferenciação, obtemos 


Ho) = (+07, 


fa) = (Dn DA + £)”. (5.94) 
A expansão de Maclaurin (Equação (5.88)) resulta em 
2 3 4 
n(lto)=2-5 +52 qto t+R 
= 5X1) — + Rr. (5.95) 
p=1 d 
Nesse caso, nosso resto é dado por 
Ra = 06, O<é<o 
SO. atada (5.96) 
n 


Agora, o resto se aproxima de zero à medida que n aumenta indefinidamente, contanto que 0 < x < 1.!? Como 
uma série infinita, 


n 


In(1 +42) = 5 (nt 12 (5.97) 


n 


n=1 


“Essa faixa pode ser estendida com facilidade para —1 < x < 1 mas não para x = —1. 
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converge para —1 < x < 1. A faixa —1 < x < 1 é estabelecida com facilidade pelo teste da razão de d' Alembert 
(Seção 5.2). Convergência em x = 1 resulta pelo critério de Leibniz (Seção 5.3). Em particular, em x = 1 temos 


1 1 1 1 E 
n2=1 = -D ln 5.98 
n Pa hE 2 J ni, (5.98) 


a série harmônica alternante condicionalmente = 


Teorema Binomial 
Uma segunda e extremamente importante aplicação das expansões de Taylor e Maclaurin é a derivação do teorema 
binomial para potências negativas e/ou não-inteiras. 

Seja f(x) = (1 + x)”, na qual m pode ser negativo e não limitado a valores inteiros. A aplicação direta da 
Equação (5.88) resulta em 


—1 
Otasi me t PED. Ra (5.99) 
Para esta função o resto é 
Ra = (1+6) m(m- 1) (m-n+1) (5.100) 
n! 


e é se encontra entre 0 e x,0 < É < x. Agora, para n > m, (1 + £)™7” é um máximo para é = 0. Portanto, 


gx” 
Rn < rm — 1) (m-=n+1). (5.101) 
n! 
Note que os m fatores dependentes não resultam em um zero, a menos que m seja um inteiro não-negativo; Rn 
tende a zero, à medida que n — oco se x for restrito à faixa O < x < 1. Por conseguinte, demonstra-se que a 
expansão binomial é 
(m=1) >, mim D(m-2) 3 


(+r) =1+mr+ Z E + 3i gp... (5.102) 


Em outra notação equivalente, 


Oo 1 [0.6] 
+" =53> Rd =y (or. (5.103) 
n=0 ` 5 n=0 


A quantidade ("7"), que é igual a m!/[n!(m—n)!], é denominada coeficiente binomial. Embora tenhamos apenas 
mostrado que o resto desaparece, 
lim R,=0, 
n—00 
na verdade podemos mostrar que, para O < x < 1,a série na Equação (5.102) é convergente para a faixa estendida 
—1 <a < 1. Para m inteiro, (m — n)! = +00 sen > m (Seção 8.1), e a série automaticamente termina em 
n=m. 


Exemplo 5.6.3 ENERGIA RELATIVISTA 
A energia relativista total de uma partícula de massa m e velocidade v é 


—1/2 
E = me (1 — =) (5.104) 


Compare essa expressão com a energia cinética clássica, mv? /2. 
Pela Equação (5.102), com z = —v2/c2em = —1/2, temos 


E=me ( É) caca A 
„acas ey] 
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ou ; 
1 3 v? 5 v2 
E=me 4 amu? + qm). 2 TRA (=) doados (5.105) 


O primeiro termo, mc”, é identificado como a energia da massa em repouso. Então, 


2 
l 3 3u? 5/u 
Ecinética = JVV 1+ Le Ei sto FERSEN (5.106) 
Para velocidade de partícula v « c, a velocidade da luz, a expressão entre colchetes se reduz à unidade, e vemos 
que a porção cinética da energia relativista total está de acordo com o resultado clássico. E 


Para polinômios podemos generalizar a expansão binomial para 


| 
(atada = en aR can, 
NINI: ce Nm: 
em que a soma inclui todas as diferentes combinações de n4,n92,...,Nm com Di ni; = n. Aqui n; e n são todos 
inteiros. Essa generalização encontra considerável uso na mecânica estatística. 
Às vezes, a série de Maclaurin pode aparecer indiretamente em vez de por utilização direta da Equação (5.88). 
Por exemplo, o modo mais conveniente de obter a expansão de série 


E E (2n—1)!! qr e aa 
= . E RO a 5.106 
e a GR Pag Pede) 


n=0 


é fazer uso da relação (de sen y = x, obtendo dy/dx = 1/1 = x2) 


sanies [a 
Tdi EE! 


Expandimos (1 — t)" 2 (teorema binomial) e então integramos termo a termo. Essa integração termo a termo é 
discutida na Seção 5.7. O resultado é a Equação (5.106a). Por fim, podemos tomar o limite enquanto x — 1. A 
série converge pelo teste de Gauss, Exercício 5.2.5. 


Expansão de Taylor — Mais de uma Variável 
Se a função f tem mais de uma variável independente, digamos, f = f(x,y), a expansão de Taylor se torna 


f(z, y) = Hab) + (x E + E 
rali PEL ra ay pai za 
+51 api a(o a)?(y pa 
+3(2 — a) (y PtU PL] Gian 


com todas as derivadas avaliadas no ponto (a, b). Usando a;t = x; — £jo, podemos escrever a expansão de Taylor 
para m variáveis independentes na forma simbólica 


OO tr m ð n 
E Di — i =— Aia J 
Fen, e ) 2 n! (Da 5) Fm e ) (k= tko k=1,..., m) 6 08) 
Uma forma vetorial conveniente para m = 3 é 
oO 1 5 
yr+a)=> (a V)"y(e). (5.109) 
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Exercícios 


5.6.1 


Mostre que 
oo 2n+1 
a E 


(a) sen z = 3-1) En + DN 


n=0 


oo 
x?” 


(b) cosx = Die ro 


n=0 


Na Seção 6.1, e'” é definida por uma expansão de série, tal que 
e” = cosa + isen q. 


Essa é a base para a representação polar de quantidades complexas. Como caso especial, podemos 
encontrar, com x = 7, a intrigante relação 


e" =-1. 


Derive uma expansão de série de cotg x em potências crescentes de x dividindo cos x por sen x. 
Nota: A série resultante que começa com 1/x é, na verdade, uma série de Laurent (Seção 6.5). 
Embora as duas séries para sen x e cos x fossem válidas para todo x, a convergência da série para 
cotg x é limitada pelos zeros do denominador, sen x (veja Continuação Analítica na Seção 6.5). 


O teste de Raabe para >), (nlnn)”! leva a 


. (n + DIn(n + 1) 
lim n 


n=>00 nlan 


1|. 


Mostre que esse limite é a unidade (o que significa que, nesse caso, o teste de Raabe é 
indeterminado). 


Mostre, por expansão de série, que 


+1 E 
o = cotgh™ tng, Ino] > 1. 
No = 


1 

-In 

2 
Essa identidade pode ser usada para obter uma segunda solução para a equação de Legendre. 
Mostre que f(x) = x!/?: (a) não tem nenhuma expansão de Maclaurin, mas (b) tem uma expansão 
de Taylor ao redor de qualquer ponto xo 0. Ache a faixa de convergência da expansão de Taylor 
ao redor de x = xo. 


Seja z uma aproximação para um zero de f(x) e Ax a correção. Mostre que, desprezando os termos 
de ordem (Ax)2, 


Essa é a fórmula de Newton para achar uma raiz. O método de Newton tem as virtudes de ilustrar 
expansões de séries e cálculo elementar, mas é muito traiçoeiro. 


Expanda uma função (x, y, z) por expansão de Taylor ao redor de (0,0,0) para O(a?). Avalie O, 
o valor médio de &, calculado pela média sobre um pequeno cubo de lado a centrado na origem e 
mostre que a laplaciana de & é uma medida do desvio de & em relação a (0, 0, 0). 


A razão de duas funções diferenciáveis f(x) e g(x) assume a forma indeterminada 0/0 em x = xo. 
Usando expansões de Taylor, prove a regra de 1" Hôpital, 


10) a FO 


ento g(z) — ento g'(2)" 
Com n > 1, mostre que 


oi- ) <0, (b) 1-a) >0. 


Use essas desigualdades para mostrar que o limite que define a constante de Euler-Mascheroni, 
Equação (5.28), é finito. 


ELSEVIER 
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5.6.10 


5.6.11 


5.6.12 


5.6.13 


5.6.14 


5.6.15 


Expanda (1 — 2tz + t2)-1/2 em potências de t. Admita que t é pequeno. Reúna os coeficientes de 
Do ED 
Resposta: e = a E 1, 
Pi(2) = 2, 


Pol) = }(82 — 1), 


em que An = P P ), o enésimo polinômio de Legendre. 


Usando a notação de duplo fatorial da Seção 8.1, mostre que 


oO 


+2n-2)!! 
1 =m/2 — 1)” (m n 
RA 2 "nan 
para m = 1,2,3,.... 
Usando expansões binomiais, compare as três fórmulas do deslocamento Doppler: 
PR 
arr =v (1 F 2) fonte se movendo; 
c 


b) v =v (1 E z) observador se movendo; 
c 


v u2 \ 12 
O vV =v (1 + ) (1 z) relativista. 
c c 


Nota: A fórmula relativista está de acordo com as fórmulas clássicas se os termos de ordem v? /c? 
puderem ser desprezados. 


Na teoria da relatividade geral há vários modos de relacionar (definir) uma velocidade de recessão de 
uma galáxia com seu afastamento para o vermelho, ô. O modelo de Milne (relatividade cinemática) 
resulta em 


(a) vı = cô (1 + J 


(b) vo = es(1 + zə) + 6) 


1 +v3/c Eds 
1 — v3/ e] 

1. Mostre que para ô < 1 (e v3/c < 1) todas as três fórmulas se reduzem a v = cô. 

2. Compare as três velocidades por meio de termos de ordem 62. 

Nota: Em relatividade especial (com ô substituído por z), a razão entre o comprimento de onda 


observado Ag é dada por 
A (: + z) pe 
Ao c—u 


A soma relativista w de duas velocidades u e v é dada por 


(c) 1+3=] 


w  ufe+vu/e 
c 1+uv/ce' 

Se do si 
Tatareg 
c c 


em que O < a < 1, ache w/c em potências de a por meio de termos em aê. 


O deslocamento x de uma partícula de massa de repouso mo, resultante de uma força constante 


mog ao longo do eixo x é 
2 4\ 271/2 
Eon a 
g c 
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5.6.16 


5.6.17 


5.6.18 


5.6.19 


5.6.20 


incluindo efeitos relativistas. Ache o deslocamento x como uma série de potências em tempo t. 
Compare com o resultado clássico, 
i2 
z= 59t. 
Usando a teoria relativista de Dirac, a fórmula de estrutura fina de espectroscopia atômica é dada 


por 


—1/2 
x? / 


E=mell+-—— s 
(s+n — |k])? 


em que 


2 2) 1/2 
s= (|k? -7 7, KEENE ES ue 
Expanda em potências de 2 pela ordem 74 (y? = Ze? /4regħc, sendo Z o número atômico). Essa 
expansão é útil em comparações das previsões da teoria de elétrons de Dirac com as de uma teoria 
relativista de elétrons de Schrödinger. Resultados experimentais apóiam a teoria de Dirac. 


Em uma colisão frontal próton-próton, a razão entre a energia cinética no centro do sistema de 
massa e a energia cinética incidente é 


R= [/2me? (Er + 2mc?) — 2mc? | / Ep. 


Ache o valor dessa razão de energias cinéticas para 
(a) Ep < me (não-relativista) 
(b) E, > me? (relativista extrema). 


Resposta: (a) > (b) 0. A última resposta é um tipo de lei 
de retornos decrescentes para aceleradores de partículas 
de altas energias (com alvos estacionários). 


Com expansões binomiais 
OO oO 
£ £ 1 = 
= ) as = [= > db 
l-z g—-1 1- 
n=1 n=0 


A soma dessas duas séries resulta em 52. 2.4" = 0. 


Tenho certeza de que todos concordamos que isso é um absurdo, mas o que deu errado? 


(a) A teoria de Planck de osciladores quantizados leva a uma energia média 


> neo exp(—neo/kT) 
So exp(—neo/kT) 


em que co é uma energia fixa. Identifique o numerador e o denominador como expansões 
binomiais e mostre que a razão entre eles é 


(e) 


(e) = 


— exp(co/kT) — 1º 
(b) Mostre que o (£) da parte (a) se reduz a kT, o resultado clássico, para kT > co. 


(a) Expanda pelo teorema binomial e integre termo a termo para obter a série de Gregory para 
y=tg lx (note que tgy = x): 


te= | crf ff +t t+ dt 
o 1+8? A | 
oo qêr+l 
=5 (17 ; [SEE 
= 2n +1 


(b) Comparando expansões de séries, mostre que 


die bja E 
CAR a O 


Sugestão: Compare com o Exercício 5.4.1. 
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5.6.21 Em análise numérica, muitas vezes é conveniente aproximar 


d2 
dz? 


iaa 5 [ple +h) — w2) + bla — h)]: 


Ache o erro dessa aproximação. 
h2 
Resposta: Erro = prO). 


5.6.22 Você tem uma função y(x) tabulada em valores igualmente espaçados do argumento 


i Yn = Y(En) 


Zn =£z+Nnh. 


Mostre que a combinação linear 


1 
Top te + 8 — 8y-1 + y-2} 
resulta em 7 
h? (5) 
4 = Tão, 
Yo 30 Yo + 


Por conseguinte, essa combinação linear resulta em y) se (h4/ 304)? e potências mais altas de h e 
derivadas de ordens mais altas de y(x) são desprezíveis. 


5.6.23 Em uma integração numérica de uma equação diferencial parcial, o laplaciano tridimensional é 
substituído por 


Vy(a,y,2) Ei h? [ylz + h, y, z) F p(z g h, y, z) 
q x,y +h,z)+Ylz,y— h, z)+ ylz, y,z +h) 
T,Y, Z = h) aa 6W(x,y,2)]. 


Determine o erro dessa aproximação. Aqui, h é o tamanho do espaçamento, a distância entre pontos 
adjacentes na direção x, y ou z. 


E 
- ( 


5.6.24 Usando precisão dupla, calcule e por sua série de Maclaurin. 
Nota: Essa abordagem simples, direta, é o melhor modo de calcular e com alta precisão. Dezesseis 
termos dão e até 16 algarismos significativos. Os fatoriais recíprocos dão convergência muito rápida. 


5.7 Série de Potências 
A série de potências é um tipo extremamente útil de série infinita da forma 


f(£) = ao + az + az? + aza? += ana”, (5.110) 
n=0 


em que os coeficientes a; são constantes, independentes de x.!º 


Convergência 
A Equação (5.110) pode ser testada de imediato para convergência pelo teste da raiz de Cauchy ou pelo teste da 
razão de d’ Alembert (Seção 5.2). Se 

An+1 
E 


=R (5.111) 


a série converge para —R < x < R. Esse é o intervalo ou raio de convergência. Uma vez que os testes da raiz e da 
razão falham quando o limite é a unidade, as extremidades do intervalo requerem especial atenção. Por exemplo, 
sean = n`}, então R = 1, pelas Seções 5.1, 5.2 e 5.3, a série converge para x = —1 mas diverge para x = +1. 
Se an = n!, então R = 0 e a série diverge para todo x 0. 


13 A Equação (5.110) pode ser generalizada para z = x + iy, substituindo x. Então, os dois capítulos seguintes darão convergência uniforme, 
integrabilidade e diferenciabilidade em uma região de um plano complexo em lugar de um intervalo no eixo x. 
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Convergência Uniforme e Absoluta 

Suponha que constatemos que nossa série de potências (Equação (5.110)) é convergente para —R < x < R; então 

ela será uniforme e absolutamente convergente em qualquer intervalo interior —S < x < S, em que 0 < S < R. 
Isso pode ser provado diretamente pelo teste M de Weierstrass (Seção 5.5). 


Continuidade 

Visto que cada um dos termos un(x) = ana” é uma função contínua de x e f(x) = X` anz” converge 

uniformemente para —S < x < S, f(x) deve ser uma função contínua no intervalo de convergência uniforme. 
Esse comportamento deve ser comparado com o comportamento surpreendentemente diferente da série de 

Fourier (Capítulo 14), no qual essa série é frequentemente usada para representar funções descontínuas, tais como 

ondas em dente de serra e ondas quadradas. 


n 


Diferenciação e Integração 
Sendo u, (x) contínua e X` ax” uniformemente convergente, constatamos que a série diferenciada é uma série de 
potências com funções contínuas e o mesmo raio de convergência da série original. Os novos fatores introduzidos 
por diferenciação (ou integração) não afetam nem o teste da raiz nem o teste da razão. Portanto, nossa série de 
potências pode ser diferenciada ou integrada com a frequência que se desejar dentro do intervalo de convergência 
uniforme (Exercício 5.7.13). 

Em vista das restrições bastante sérias aplicadas à diferenciação (Seção 5.5), esse é um resultado notável e 
valioso. 


Teorema da Unicidade 

Na seção precedente, usando a série de Maclaurin, expandimos e” e In(l + x) em séries infinitas. Nos 
capítulos subseqüentes, funções são frequentemente representadas ou talvez definidas por séries infinitas. Agora, 
determinamos que a representação da série de potências é única. 


Se 
f) = X ana”, —Ra <x < Ra 
n=0 
= 5 bnz”, -R< x< Re, (5.112) 
n=0 


com intervalos de convergência sobrepostos, incluindo a origem, então 
An = bn (5.113) 


para todo n; isto é, admitimos duas representações (diferentes) de séries de potências e passamos a mostrar que, 
na verdade, as duas são idênticas. 
Pela Equação (5.112), 


5 anz” = = bau”, —-R<a<rR, (5.114) 
n=0 n=0 


em que R é o menor de Ra, Rẹ. Estabelecendo x = 0 para eliminar todos os termos, exceto os constantes, obtemos 
ao = bo. (5.115) 


Agora, explorando a diferenciabilidade de nossa série de potências, diferenciamos a Equação (5.114), obtendo 


so napr”! = a nbag"o 1. (5.116) 
n=1 n=1 


Mais uma vez estabelecemos x = 0, para isolar os novos tempos constantes e achamos 
a = bı. (5.117) 


Repetindo esse processo n vezes, temos 
an = bn, (5.118) 
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o que mostra que as duas séries coincidem. Portanto, nossa representação de séries de potências é única. 

Isso será um ponto crucial na Seção 9.5, na qual usamos uma série de potências para desenvolver soluções 
de equações diferenciais. Essa unicidade da série de potências aparece com muita frequência na física teórica. O 
estabelecimento da teoria da perturbação em mecânica quântica é um exemplo. A representação de funções por 
séries de potências costuma ser útil para avaliar formas indeterminadas, em particular quando a regra de l’ Hôpital 
pode ser incômoda de aplicar (Exercício 5.7.9). 


Exemplo 5.7.1 REGRA DEL'HôprraL 


Avalie à 
— cos £ 

lim ———. 1 

bm GH) 
Substituindo cos x por sua expansão de série de Maclaurin, obtemos 

l— cosx 1-(1 no + hat Go o 
g q? 2 4 Des 
Deixando que x — 0, temos 
1 — cos 1 
ima as (5.120) 


A unicidade de séries de potências significa que os coeficientes a, podem ser identificados com as derivadas 


em uma série de Maclaurin. Por 
< n — 1 n n 
Ho)= mm =5 5100 
n=0 n=0 


temos i 
= (n) 
an = a (0). 


E 
Inversão de Séries de Potências 
Suponha que temos uma série 
y — yo = a (£ — £0) + az(x — £0)? +: = ana xo)”. (5.121) 
n=1 


Isso dá (y — yo) em termos de (x — zo). Contudo, pode ser desejável ter uma expressão explícita para (x — xo) em 
termos de (y — yo). Podemos resolver a Equação (5.121) para x — xo por inversão de nossa série. Admita que 


x£= zo = X` ba(y— yo)”, (5.122) 
n=1 


com b, determinado em termos de ap. Uma abordagem de força bruta, que é perfeitamente adequada para 
alguns poucos primeiros coeficientes, é simplesmente substituir a Equação (5.121) na Equação (5.122). Igualando 
coeficientes de (a — xo)” em ambos os lados da Equação (5.122), uma vez que a série de potências é única, obtemos 


1 
bı DIE 
a 
a2 
bo = “a? 
L a2 
by = (205 — mas), (5.123) 
ai 
1 
b= > (5a1a203 = atas = 5a3), e assim por diante. 
ai 


Alguns dos coeficientes mais altos são listados por Dwight. !4 


4H. B. Dwight, Tables of Integrals and Other Mathematical Data, 4é ed. Nova York: Macmillan (1961). (Compare com a Fórmula nº 50.) 
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Exercícios 
5.71 A clássica teoria do magnetismo de Langevin leva a uma expressão para a polarização magnética, 


Pta) = (Ez a] 


senhx q 


Expanda P(x) como uma série de potências para pequenos x (campos baixos, alta temperatura). 


5.7.2 O fator de despolarização L para um elipsóide oblato em um campo elétrico uniforme paralelo ao 
eixo de rotação é 
1 


L= — 
E0 


(1+ ca) (1 — Co cot™* Ço), 


em que Ço define um elipsóide oblato em coordenadas esféricas oblatas (£, Ç, y). Mostre que 


1 1 
lim L= + (esfera), lim L= — (lâmina fina). 
Co—00 3€0 Co 0 E0 
5.7.3 O fator de despolarização (Exercício 5.7.2) para um elipsóide prolato (oblongo) é 
1 1 no + 1 
L= 3-1 In -2 1). 
a (3m in ) 
Mostre que 
1 
lim L= — (esfera), lim L=0 (agulha longa). 
No=00 3€0 no>0 
5.7.4 A análise do padrão de difração de uma abertura circular envolve 


27 
I cos(c cos 7) dọ. 
0 


Expanda o integrando em uma série e integre usando 


27 27 
2n (2n)! f 2n+1 
cos” p dy = rms ` 2T, cos pdp = 0. 
J 227 (nl)? o 


O resultado é 27 vezes a função de Bessel Jo(c). 


5.7.5 Nêutrons são criados (por uma reação nuclear) dentro de uma esfera oca de raio R. Os nêutrons 
recém-criados são distribuídos uniformemente pelo volume esférico. Admitindo que todas as 
direções são igualmente prováveis (isotropia), que distância média um nêutron percorrerá antes 
de se chocar com a superfície da esfera? Admita movimento em linha reta sem colisões. 


(a) Mostre que 
1 T 
T= ar f / V1 — k2sen20k? dkseno do. 
o Jo 


(b) Expanda o integrando como uma série e integre para obter 


OO 


1 


À SA (2n — D(2n + 1)(2n + 3) 


(c) Mostre que a soma dessa série infinita é 1/12, dando 7 = ir. 


Sugestão: Mostre que sn = 1/12 — [4(2n + 1)(2n + 3)]"! por indução matemática. Então deixe 
n > 00. 


5.7.6 Dado que 


ELSEVIER 
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5.7.7 


5.7.8 


5.7.9 


5.7.10 


5.7.11 


5.7.12 


expanda o integrando em uma série e integre termo a termo, obtendo!5 
T 1 1 1 1 1 
| isa 1)” Sew 
4 aa au Sia TE a 


que é a fórmula de Leibniz para m. Compare a convergência da série integranda e a da série integrada 
em x = 1. Veja também o Exercício 5.7.18. 


Expanda a função fatorial incompleta 


y(n+ 1,2) =f Ep dt 
0 


em uma série de potências de x. Qual é a faixa de convergência da série resultante? 


1 £ Fo q? 
n+1 n+2 2(n+3) 
—1)Pz? 

=i +l. 


“p(n+p+1) 


RESP. et dt = rh | 
0 


Derive a expansão de série da função beta incompleta 


Bapo) = | Para 
(0) 


t. == 
-arfis q pg ny } 
p p+l1 n!(p+ n) 
para 0 < x < 1, p > 0, eq > 0 (se x = 1). 
Avalie 
(a) lim [sen(tgx) — tg(sen x)| £77, (b) lim a Cjn(a), n=3, 


em que jn (x) é uma função esférica de Bessel (Seção 11.7), definida por 


aose ( EN (E), 
1 1 


1 
b 
30º VIs nF 105 
A teoria do transporte de nêutrons dá a seguinte expressão para o inverso do comprimento de difusão 


de nêutrons de k: 
a-b, a/k -1 
k 9 aj) ` 


Por inversão da série ou de outra maneira, determine k? como uma série de potências de b/a. Dê os 
dois primeiros termos da série. 


Resposta : (a) para n = 3. 


4b 
Resposta: k? = sab(1 — io). 
5a 


Desenvolva uma expansão de série de y = sen Ah” lx (isto é, sen hy = x) em potências de x por 
(a) inversão da série para sen hy, 
(b) uma expansão de Maclaurin direta. 


Uma função f(z) é representada por uma série descendente de potências 
(0,6) 
Re) = ai R<z<o. 
n=0 


Mostre que essa expansão de série é única; isto é, se f(z) = Ea bnz”, R < z < œ, então 
an = bn para todo n. 


15 A expansão da série de tg +x (limite superior 1 substituído por x) foi descoberta por James Gregory em 1671, três anos antes de Leibniz. 
Veja o interessante livro A History of Pi , 2 ed., Boulder, C.O. Golem Press (1971) e L. Berggren, J. e P. Borwein, Pi: A Source Book, Nova 
York: Springer (1997). 
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5.7.13 


5.7.14 


5.7.15 


5.7.16 


5.7.17 


5.7.18 


5.7.19 


Uma série de potências converge para —R < x < R. Mostre que a série diferenciada e a série 
integrada têm o mesmo intervalo de convergência. (Não se preocupe com as extremidades x = +R.) 


Admitindo que f(x) pode ser expandida em uma série de potências ao redor da origem, f(x) = 
= anx”, com alguma faixa de convergência não-zero. Use as técnicas empregadas para provar 
unicidade da série para mostrar que sua série pretendida é uma série de Maclaurin: 


f™ 0). 


1 
an= 
n: 


A fórmula de Klein-Nishina para o espalhamento de fótons por elétrons contém um termo da forma 


ty = do 2+2e In(14+2€) | 


e2 1+ 2e E 


Aqui, € = hv/mæ, a razão entre a energia do fóton e a energia da massa de repouso do elétron. 
Ache 


lim f(e). 


e>0 


.4 
Resposta: 5. 


O comportamento de um nêutron que está perdendo energia por colidir elasticamente com núcleos 
de massa A é descrito por um parâmetro é,, 


E Am 
2A “AFL 


Uma aproximação, boa para A grande, é 


2 


Rs; 


Expanda é, e £, em potências de A”!. Mostre que £, concorda com £, por meio de (A”!)2. Ache 
a diferença nos coeficientes do termo (A7 t)’. 


Mostre que cada uma dessas duas integrais é igual à constante de Catalan: 


dt 1 dx 
o f arc tg bs (= f AR 


Nota: Veja 6(2) na Seção 5.9 para o valor da constante de Catalan. 


Calcule 7 (precisão dupla) para cada uma das seguintes expressões de arco tangente: 


n=16tg(1/5) -4tg + (1/239) 
n=24g (1/8) +8tg !(1/57) +4tg !(1/239) 
r=a48tg (1/18) +32tg !(1/57) — 20tg + (1/239). 


Obtenha 16 algarismos significativos. Verifique as fórmulas usando o Exercício 5.6.2. 
Nota: Essas fórmulas têm sido usadas em alguns dos cálculos mais precisos de 7.!é 


Uma análise do fenômeno de Gibbs da Seção 14.5 leva à expressão 


2 [7 sené 
É E dE. 


(a) Expanda o integrando em uma série e integre termo a termo. Ache o valor numérico dessa 
expressão para quatro algarismos significativos. 
(b) Avalie essa expressão pela quadratura gaussiana, se disponível. 


Resposta: 1,178980. 


16D, Shanks e J. W. Wrench, “Computation of 7 to 100000 decimals”. Math. Comput. 16: 76 (1962). 
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5.8 Integrais Elípticas 

Integrais elípticas estão incluídas aqui em parte como uma ilustração do uso de séries de potências e em parte 
por seu próprio interesse intrínseco. Esse interesse inclui a ocorrência de integrais elípticas em problemas físicos 
(Exemplo 5.8.1 e Exercício 5.8.4) e aplicações em problemas matemáticos. 


Exemplo 5.8.1 PERÍODO DE UM PÊNDULO SIMPLES 


Para oscilações de pequena amplitude, nosso pêndulo (Figura 5.8) tem movimento harmônico simples com um 
período T = 27(1/9)!/2. Para uma amplitude máxima 04 suficientemente grande para que sen Oy + Om, a 
segunda lei do movimento de Newton e a equação de Lagrange (Seção 17.7) levam a uma equação diferencial 
não-linear (sen 6 é uma função não-linear de 0), portanto recorremos a uma abordagem diferente. 


Figura 5.8: Pêndulo simples. 


A massa oscilante m tem uma energia cinética de ml? (d /dt)? /2 e uma energia potencial de —mgl cos O 
(8 = m/2 tomado para o zero arbitrário de energia potencial). Uma vez que d0 /dt = 0 em 6 = 0m, a conservação 
de energia dá 


1 o /d0\? 
z™ aF mglcos 0 = —mgl cos Om. (5.124) 
Resolvendo para df /dt, obtemos 
do Dane 
== (2) (cos 6 — cos 8m) "2, (5.125) 


sendo que a massa m é cancelada. Admitimos que t é zero quando 6 = 0 e dð /dt > 0. Uma integração de 8 = 0 a 


0 = m resulta em 
Om 90 NM? pt 9042 
f (cos 0 — cos0m) 1? do = (22) E dt = (22) t (5.126) 
0 0 


Isso é 1 de um ciclo e, portanto, o tempo t é 1 do período T. Notamos que 0 < 0 m; com um pouco de clarividência, 
tentamos a substituição 
0 0 
sen(5) = son ( A Json p. (5.127) 
2 2 
Com isso, a Equação (5.126) se torna 


NV? pr/2 g —1/2 
T= (5) / (1 — sen? GED dy. (5.128) 
(0) 


Embora não seja uma melhoria óbvia em relação à Equação (5.126), a integral agora define a integral elíptica 
completa de primeira ordem, K (sen? m /2). Por expansão de série, o período de nosso pêndulo pode ser 
desenvolvido como uma série de potências — potências de sen 0 m /2: 


11⁄2 1 8 9 a0y 
T=2m(5) TE M L sent Lee (5.129) 
g 
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Definições 
Generalizando o Exemplo 5.8.1 para incluir o limite superior como uma variável, a integral elíptica de primeira 
ordem é definida como 


Y 
F(ylo) = f (1— sen?asen?0) "2 do, (5.130a) 


ou 
F(z|m) = J (0-1-2 mA a, o<m<l (5.130b) 
0 


(Essa é a notação de AMS-55, veja a nota de rodapé 4 para a referência.) Para y = 7/2,4 = 1, temos a integral 
elíptica completa de primeira espécie 


r/2 2-1/2 
K(m) = (1 — msen?6) do 
0 


1 
A i= eem 2 a, (5.131) 
0 


com m = senta, 0< m < 1. 
A integral elíptica da segunda espécie é definida por 


ú 2 29)1/2 
Elpla) =[ (1 — sen?asen?9) ““ do (5.132a) 
0 
ou 
2/1 mt! 
5 = 


Mais uma vez, para o caso de y = 7/2, x = 1, temos a integral elíptica completa de segunda espécie: 
T/2 1/2 
E(m) = s (1 — msen?6) ““ do 
0 


1 tio t2 1/2 
Rr, E) dt, e (5.133) 
E 


O Exercício 5.8.1 é um exemplo de sua ocorrência. A Figura 5.9 mostra o comportamento de K(m) e de E(m). 
Tabelas extensivas estão disponíveis em AMS-55 (veja o Exercício 5.2.22 para a referência). 


Expansão de Série 
Para nossa faixa 0 < m < 1, o denominador de K (m) pode ser expandido pela série binomial 


e 2sento +... 


1 3 
(1 — msen?0) =1+ 5msentg + gm 
= DD men? (5.134) 


n=0 


4 


Para qualquer intervalo fechado [0,mmáxl:Mmáx < 1, essa série é uniformemente convergente e pode ser 


integrada termo a termo. Pelo Exercício 8.4.9, 


n/2 2n — 1)!! 
| sen?” 0 do = Ca a Z 
0 


T 
ml E (5.135) 


Daí o (145 [Cone mr) (5.136) 


Elm) = 541 [Gm] 2) (5.137) 


De forma semelhante, 
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Figura 5.9: Integrais elípticas completas, K(m) e E(m). 


(Exercício 5.8.2). Na Seção 13.5 essas séries são identificadas como funções hipergeométricas, e temos 


11 

K(m) = anfa 5 tm) (5.138) 
11 

E(m) = 52M (= im) (5.139) 


Valores Limitativos 
Pelas Equações (5.136) e (5.137) ou pela definição de integrais, 


T 
dim, K(m) = > (5.140) 
T 
dim, E(m) = z (5.141) 
Para m — 1, as expansões de séries têm pouca utilidade. Contudo, as integrais nos dão 
tim K(m) = œ, (5.142) 
sendo que a integral diverge por logaritmos e 
tim Elm) =1. (5.143) 


As integrais elípticas foram usadas extensivamente no passado para avaliar integrais. Por exemplo, integrais da 
forma 


x 
I= J R(t, Vautt + agt? + azt? + ait! + ao ) dt, 
0 
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em que R é uma função racional de t e do radical, podem ser expressas em termos de integrais elípticas. Jahnke 
e Emde, Tables of Functions with Formulae and Curves, Nova York: Dover (1943), Capítulo 5, dá páginas de tais 
transformações. Agora que temos computadores disponíveis para avaliação numérica direta, o interesse por essas 
integrais elípticas diminuiu. Contudo, o interesse pelas integrais elípticas ainda se mantém porque aparecem em 
problemas físicos — veja os Exercícios 5.8.4 e 5.8.5. 

Se quiser um apanhado extensivo de funções elípticas, integrais e funções O de Jacobi, consulte o tratado de 
Whittaker e Watson, A Course in Modern Analysis, 4º ed., Cambridge, UK, Cambridge University Press (1962). 


Exercícios 


5.8.1 A elipse x? /a? + y2/b? = 1 pode ser representada parametricamente por x = asen 0,3 = bcos 0. 
Mostre que o comprimento do arco contido no primeiro quadrante é 


T/2 21/2 
a (1 — msen?0) “É do = aE(m). 
0 


Aqui, 0 < m = (a? — b?) /a? < 1. 


5.8.2 Derive a expansão de série 
Nm /1-3\ m? 
E = 1 
maae e Tor) 
5.8.3 Mostre que 
lim =) ER 
m=>0 m 4 


(o, 9, z) 


I 
x ~ (p, p, 0) 
Figura 5.10: Circuito elétrico circular. 


5.8.4 Um circuito elétrico circular no plano xy, como mostra a Figura 5.10, transporta uma corrente 7. 
Dado que o potencial vetorial é 


A (9,9,2) = E f cos a da 
LABEA 2n Jo (a? +p? +22- 2ap cosa)!’ 


ELSEVIER 
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5.8.10 


mostre que 
1/2 2 
Uol fa k 
Al, p,2) = E (=) (1 - E)K) E zE), 
em que 
2, 4ap 
GFF 


Nota: Para extensão do Exercício 5.8.4 para B, veja Smythe, p. 270.17 


Uma análise do potencial vetorial magnético de um circuito elétrico circular leva à expressão 
(K?) = K’ [(2 = k’) K (k?) — 2E(k°)], 


em que K(k?) e E(k?) são as integrais elípticas completas da primeira e segunda espécies. Mostre 
que para k? < 1 (r >> raio do circuito) 


Ns mk? 
6) = e 
Mostre que 
dE(k2) 1 
dK (k? E K 
oaan 


dk k(l- k?) k` 
Sugestão: Para a parte (b), mostre que 


Fei 3/2 
E(k?) = (1- e f (1 — ksen20) “2 do 
0 


por comparação de expansões de séries. 


(a) Escreva uma sub-rotina de função para calcular E (m.) pela expansão de série, Equação (5.137). 
(b) Teste sua sub-rotina de função usando-a para calcular m = 0,0(0, 1)0,9 e compare o resultado 
com os valores dados por AMS-55 (veja o Exercício 5.2.22 para a referência). 


Repita o Exercício 5.8.7 para K(m). 

Nota: Essas séries para E(m), Equação (5.137), e K(m), Equação (5.136), convergem apenas 
muito lentamente para m próximo de 1. Existem séries que convergem com maior rapidez para 
Elm) e K(m). Veja as Tabelas de Integrais de Dwight:!8 nºs 773.2 e 774.2. Sua sub-rotina de 
computador para calcular E e K provavelmente usa aproximações polinomiais: AMS-55, Capítulo 
17. 


Um pêndulo simples está oscilando com uma amplitude máxima de 9. No limite, à medida que 
m — 0, o período é 1 s. Usando a integral elíptica, K (k2), k = sen(0m/2), calcule o período T 
para 0m = 0 (10º) 90º. 

Cautela: Algumas sub-rotinas de integrais elípticas requerem k = m 
entrada e não o próprio m. 


1/2 como um parâmetro de 


io cestos COR OE a TI] cO0R 
Valores de verificação. (co) | 1,00193 | 1.05033 | 1,18258 | 
Calcule o potencial vetorial magnético A(p,7,2) = PA;(p,,2) de um circuito circular de 


corrente elétrica (Exercício 5.8.4) para as faixas p/a = 2,3,4e z/a = 0,1, 2,3,4. 
Nota: Esse cálculo de integral elíptica do potencial vetorial magnético pode ser verificado pelo 
cálculo de uma função de Legendre associada, Exemplo 12.5.1. 


Valor de verificação. Para p/a = 3 e z/a = 0; A, = 0, 029023 u91. 


11W, R. Smythe, Static and Dynamic Electricity, 3% ed. Nova York: McGraw-Hill (1969). 
8H. B. Dwight, Tables of Integrals and Other Mathematical Data. Nova York: Macmillan (1947). 
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5.9 Números de Bernoulli e Fórmula de Euler-Maclaurin 

Os números de Bernoulli foram introduzidos por Jacques (James, Jacob) Bernoulli. Há diversas definições 
equivalentes, mas é preciso tomar muito cuidado, porque alguns autores introduzem variações na numeração ou 
em somas algébricas. Uma abordagem relativamente simples é definir os números de Bernoulli pela série!? 


x z Brna” 
=o ; (5.144) 
É n=0 


que converge para |z| < 27 pelo teste da razão substituta, Equação (5.153) (veja também o Exemplo 7.1.7). 
Diferenciando essa série de potências repetidas vezes e então estabelecendo x = 0, obtemos 


d” 
pea e pA , (5.145) 
da” er —1/],>0 
Especificamente, 
d g 1 xe” 1 
1 dæ (=) E a (Ea 27 ( ) 
como pode ser visto pela expansão de série dos denominadores. Usando Bo = 1 e Bı = — > é fácil verificar que 
a função 
£ £ = a £ $ 
-1+5 = Bare 1 147 
el t 2 > n! et—-1 2 Rea) 


é par em x, portanto todo Bən+1 = 0. 
Para derivar uma relação de recursão para os números de Bernoulli, multiplicamos 


OO 


e"-1 r g x 2 gr 
= 15 1 Bən —— 
z e-l PEN rÈ E E) 


B 
N 2n 
; 5.148 
PL À Na rasa) 
N=2  1<n<N/2 


Para N > 0, o coeficiente de x” é zero, portanto a Equação (5.148) resulta em 


1 N40 1 
o Adi 5 Ban o ) -40-9 (5.149) 
1<n<N/2 


que é equivalente a 


N 
1 2N +1 
N-5= Bom , 
2 2 nl 2n ) 


n=1 


N-I 
2N 
N-1l= Bon ; 
Do] 


n=1 


(5.150) 


Pela Equação (5.150), os números de Bernoulli apresentados na Tabela 5.1 são obtidos imediatamente. Se a variável 
x na Equação (5.144) for substituída por 2ix, obtemos uma definição alternativa (e equivalente) de Bən (Bı é 
igualado a -4 pela Equação (5.146)) pela expressão 


So 940) 2m 
acotga = LOD" Ban o -T LE<T. (5.151) 
n=0 ` 


19A função «/(e” — 1) pode ser considerada uma função geradora, uma vez que gera os números de Bernoulli. Funções geradoras das 
funções especiais da física matemática aparecem nos Capítulos 11, 12 e 13. 
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Usando o método de resíduos (Seção 7.1) ou partindo da representação de produto infinito de sen x (Seção 5.11), 
constatamos que 


(=) -12(2n)! À o 
Ban = + — AR =1,2,3,.... 152 
i Gon P de pao 


Tabela 5.1 Números de Bernoulli 


n Ba Ba 
0 1 1,0000 00000 
1 -4 —0,5000 00000 
2 i 0,1666 66667 
4 -5 —0,0333 33333 
6 b 0,0238 09524 
8 -5 —0,0333 33333 
10 Š 0,0757 57576 


Nota: Mais valores são dados pelo National Bureau 
of Standards, Handbook of Mathematical Functions 
(AMS-55). Veja a nota de rodapé 4 para a referência. 


Essa representação dos números de Bernoulli foi descoberta por Euler. É imediatamente evidente pela 
Equação (5.152) que | Bs, aumenta sem limite, à medida que n — infty. Valores numéricos foram calculados 
por Glaisher.?º Ilustrando o comportamento divergente dos números de Bernoulli, temos 


Boo = —5, 291 x 102 
B200 = —3, 647 x 10°15. 


Alguns autores preferem definir os números de Bernoulli com uma versão modificada da Equação (5.152), usando 


2(2n)! E 
Ban = = DS do (5.153) 
p=1 


2 


sendo que o índice inferior é apenas metade de nosso índice inferior e todos os sinais são positivos. Mais uma vez, 
quando usar outros textos ou referências, você deve verificar para ver exatamente como os números de Bernoulli 
são definidos. 

Os números de Bernoulli ocorrem com fregiiência na teoria dos números. O teorema de Staudt-Clausen afirma 
que 


1 1 1 1 
Bon = An ne (5.154) 
Pı P2 P3 Pk 


no qual 4, é um inteiro e p1, P2,...,pp são números primos, de modo que p; — 1 é um divisor de 2n. Pode-se 
verificar de imediato que isso é válido para 


Be (A3 FE 1,p = 2,3,7), 
Bs(A4 = 1,p = 2,3,5), (5.155) 
Bro(As = 1,p = 2,3, 11), 


e outros casos especiais. 
Os números de Bernoulli aparecem no somatório de potências integrais dos inteiros, 


5 9º, p inteiro, 


207. W, L. Glaisher, tabela dos primeiros 250 números de Bernoulli (até a nona casa decimal) e seus logaritmos (até a décima casa decimal). 
Trans. Cambridge Philos. Soc. 12: 390 (1871-1879). 
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e em numerosas expansões de série de funções transcendentais, incluindo tgz, cotgx, ln |sen x|, (sen ic 
In [cos z|, In |tgz|, (cotgx)™t, tgx, e cotgx. cotgx. Por exemplo, 


3 2 —1 n—l92n 22n — 1)Bon 
PRE e E ) ( )B2 qro 


TE E pese, (5.156) 


É bem provável que os números de Bernoulli apareçam nessas expansões de série por causa das equações 
definidoras (5.144), (5.150) e (5.151) e por causa de sua relação com a função zeta de Riemann, 


(2n) =X pr (5.157) 


Polinômios de Bernoulli 
Se a Equação (5.144) for ligeiramente generalizada, temos 


tels e x” 
aF B (5.158) 


definindo os polinômios de Bernoulli, B, (s). Os primeiros sete polinômios de Bernoulli são dados na Tabela 5.2. 


Tabela 5.2 Polinômios de Bernoulli 


Bo=1 

Bj=ar-5 

B=2-2+5 

B; = z? — 3a? + ir 

B, = 1f — 22? + 2° — & 

B; = z’ — Šg + Šg — łgz 
Be = zê — 3x3 + dq 342 + b 


Ba(0) = Bn, número de Bernoulli 


Pela função geradora, Equação (5.158), 
Ba(0) = Ba, ÉS À Po RR 2a (5.159) 


o polinômio de Bernoulli avaliado em zero é igual ao número de Bernoulli correspondente. Duas propriedades 
particularmente importantes dos polinômios de Bernoulli resultam da relação de definição, Equação (5.158): uma 
relação de diferenciação 


— Ba(s) = nBn-1(8), n=1,2,38 005 (5.160) 
e uma relação de simetria (substitua x — — na Equação (5.158), e então faça s = 1) 

Ba(1) = (—1)” Ba(0), = 2 sa (5.161) 
Essas relações são usadas no desenvolvimento da fórmula de integração de Euler-Maclaurin. 


Fórmula de Integração de Euler-Maclaurin 
Uma das utilizações das funções de Bernoulli é na derivação da fórmula de integração de Euler-Maclaurin. Essa 
fórmula é usada na Seção 8.3 para o desenvolvimento de uma expressão assintótica para a função fatorial — série 
de Stirling. 

A técnica é a integração repetida por partes, usando a Equação (5.160) para criar novas derivadas. Começamos 
com 


far f f(x) Bo(x) dz. (5.162) 
0 0 


Pela Equação (5.160) e Exercício 5.9.2, 
Bi(a) = Bo(x) = 1. (5.163) 
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Substituindo B; (x) na Equação (5.162) e integrando por partes, obtemos 


1 


f Ho) de = f)B1(1) - 10)Bi(0) - | 1(0)Bi(0) de 


= 50) + f(0)] - | f(x)Bi(x) dz. (5.164) 


0 
Mais uma vez, usando a Equação (5.160), temos 


1 
Bı (2) = > B;(2), (5.165) 


e integrando por partes, obtemos 


J 1o d= 5O 0] = LUCA) - OBO] 
taf fO (x)Ba(x) dz. (5.166) 


Usando as relações 


Bon(1) = Ban (0) = Bən, n=0,1,2,... 


(5.167) 
Bmn(D)=Bma(0)=0,  n=1,2,3,... 
e continuando esse processo, temos 
1 1 Lead 
, 0ds = 3) + f0) -È Ta” T PESO] 
+ am f ! [CD (x) Bola) de. (5.168a) 


Essa é a fórmula de integração de Euler-Maclaurin. Ela supõe que a função f(x) tem as derivadas requeridas. 
A faixa de integração na Equação (5.168a) pode ser deslocada de [0, 1] para [1, 2] substituindo f(x) por f(x +1). 
Adicionando esses resultados até [n — 1, n], obtemos 


todo = 80 + 10410) ++ fn= D+ 5100) 
p p[er? (n) — f-0(0)] 
EN : E e 
+a f, Pal Z) 1a + 0) da (5.168) 


Os termos 5 f(0) + (1) +--:+ 5 f (n) aparecem exatamente do mesmo modo como na integração trapezoidal, 
ou quadratura. O somatório sobre p pode ser interpretado como a aproximação trapezoidal. A Equação (5.168b) 
pode ser vista como uma generalização da Equação (5.22): é a forma usada no Exercício 5.9.5 para somar potências 
positivas de inteiros e na Seção 8.3 para a derivação da fórmula de Stirling. 


A fórmula de Euler-Maclaurin costuma ser útil para somar séries convertendo-as em integrais?! 


2l Veja R. P. Boas e C. Stutz, Estimating sums with integrals. Am. J. Phys. 39: 745 (1971), para vários exemplos. 


“livro” — 2007/81 — 15:06 — page 290 — #300 


290 Física Matemática Arfken e Weber 


ELSEVIER 


Função Zeta de Riemann 


Tabela 5.3 Função zeta de Riemann 


S 


C(s) 


1,6449340668 
1,2020569032 
1,0823232337 
1,0369277551 
1,0173430620 
1,0083492774 
1,0040773562 
1,0020083928 
1,0009945751 


2 

3 

4 

5 

6 

7 

8 

9 

10 
10,06 
1,0Ł 
0,1 L 
TAA qui 
o E 
0,01É 
0,001 É 

0,0001 l 


Figura 5.11: Função zeta de Riemann, ((s) — 1 versus s. 


| 
[aros 


AE 
A SG 8 10 12 


Essa série, Ea p”?”, foi usada como uma série de comparação para testar convergência (Seção 5.2) e na 
Equação (5.152) como uma definição dos números de Bernoulli, Bən. Também serve para definir a função zeta de 


Riemann por 


U)=Dn*, s>1 (5.169) 
n=1 
A Tabela 5.3 relaciona os valores de ¢(s) para s inteiro, s = 2,3,...,10. Formas fechadas para s par aparecem no 


Exercício 5.9.6. A Figura 5.11 é um gráfico de C(s) — 1. Uma expressão integral para essa função zeta de Riemann 
aparece no Exercício 8.2.21 como parte do desenvolvimento da função gama, e a relação funcional é dada na Seção 


14.3. 


O célebre produto de números primos de Euler para a função zeta de Riemann pode ser derivado como 


(1-2) =1+ 


FR da 
3 28 "48 


(5.170) 
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eliminando todos os n”*, em que n é um múltiplo de 2. 


1 1 1 1 


g ga AGR S 


e 
E TES te) ii 


eliminando todos os termos remanescentes nos quais n é um múltiplo de 3. Continuando, temos ¢(s)(1 — 27°)(1 — 
375)(1—578)--- (1— P75), P é um número primo, e todos os termos n”*, nos quais n é um múltiplo de qualquer 
inteiro até P, são cancelados. A medida que P — oo, 


)(1-2"9(1-3")=1+ 


cs) (1 — a) (1 — 37$) e (1 — RE) > G(s) JI (1 — P=) Sok (5.172) 
P(primo)=2 
Portanto, 
j= [| 0-77; (5.173) 
P(primo)=2 


dando Ç(s) como um produto infinito.?? 

Esse procedimento de cancelamento tem uma clara aplicação em computação numérica. A Equação (5.170) 
dará ¢(s)(1 — 27º) com a mesma precisão que a Equação (5.169) dá C(s), mas com apenas metade do número de 
termos. (Em qualquer dos casos, seria feita uma correção para a cauda desprezada da série pela técnica do teste da 
integral de Maclaurin — substituindo a série por uma integral, Seção 5.2.) 

Juntamente com a função zeta de Riemann, AMS-55 (Capítulo 23. Veja o Exercício 5.2.22 para a referência) 
define três outras séries de Dirichlet relacionadas com ¢(s): 


n(s) = X (CHT n = (1 — 217°) c(s), 
A(8) = P(n +1) = (1-2-(9), 
Bie) = X On +. 
n=0 


Pelos números de Bernoulli (Exercício 5.9.6) ou séries de Fourier (Exemplo 14.3.3 e Exercício 14.3.13), valores 
especiais são 


g eig 
D e 
1 1 
ARERR T =a , 
1 o1 
BB) =l- 5t esi 


2 Esse é o ponto de partida para as aplicações extensivas da função zeta de Riemann à teoria analítica dos números. Veja H. M. Edwards, 
Riemann's Zeta Function. Nova York: Academic Press (1974); A. Ivić, The Riemann Zeta Function. Nova York: Wiley (1985); S. J. Patterson, 
Introduction to the Theory of the Riemann Zeta Function. Cambridge, UK: Cambridge University Press (1988). 
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A constante de Catalan, 


1 1 
B(2)=1— zz + gz — = 0,91596559..., 


é o tópico do Exercício 5.2.22. 


Melhoria da Convergência 


Se tivermos de somar uma série convergente 52º, am cujos termos são funções racionais de n, a convergência 


pode ser melhorada drasticamente pela introdução da função zeta de Riemann. 


Exemplo 5.9.1 MELHORIA DA CONVERGÊNCIA 
O problema é avaliar a série 572, 1/(1 + n2). Expandindo (1 + n2)! =n-2(1 + n72)”! por divisão direta, 
temos 


—6 
(1 + ny =n? (1 nº? pnt és ) 


1 +n? 
o 1 1 1 1 
nm nå ni npn 
Portanto, 
X 1 = 1 
5 Iin? STU E 
n=1 n=1 


Os valores Ç são tabulados e a série do resto converge como n~’. É claro que o processo pode ser continuado como 
se quiser. Você escolhe quanta álgebra fará e quanta aritmética o computador fará. Outros métodos para melhorar 


a efetividade computacional são dados ao final das Seções 5.2 e 5.4. E 
Exercícios 
5.9.1 Mostre que 
REA m A T T 
tgx = E —><4<-. 
A > Cn)! 4 2575732 


Sugestão: tgx = cotgx — 2cotg2zx. 


5.9.2 Mostre que os primeiros polinômios de Bernoulli são 
Bo(s) =1 
Bi(s)=s—5 


Note que B,(0) = Bn, o número de Bernoulli. 
5.9.3 Mostre que Bi (s) = nBa-i(s), n=1,2,3,.... 
Sugestão: Diferencie a Equação (5.158). 
5.9.4 Mostre que 
Ba(1) = (—1)" Ba(0). 


Sugestão: Volte à função geradora, Equação (5.158), ou ao Exercício 5.9.2. 


5.9.5 A fórmula de integração de Euler-Maclaurin pode ser usada para a avaliação de séries finitas: 
” K 1 1 Bar j 
De mE a a a + 
m=1 0 f 
Mostre que 


(a) 5 m= sn(n+ 1). 
m=1 


ELSEVIER 
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5.9.10 


b) Dm? = ento +1)(2n + 1). 
m=1 


m=1 
(d) Sim! = nln + 1)(2n + 1) (3n? +3n — 1) 
m=1 
Por X2 j! 
— /(_1\rn-l1 n 
Bon fi ( 1) (2m)2m C(2n), 
mostre que 
2: 8 
DADE BM 
4 10 
ODE OS10)= 
mê 
(c) G(6) = 945 


A lei da radiação do corpo negro de Planck envolve a integral 


S x dz 
0 et — 1 


Mostre que isso é igual 6¢(4). Pelo Exercício 5.9.6, 


Sugestão: Use a função gama, Capítulo 8. 


© gre? de 
f C n!¢(n). 


Prove que 


Admitindo que n é real, mostre que cada lado da equação diverge se n = 1. Por conseguinte, a 
equação precedente acarreta a condição n > 1. Integrais como essa aparecem na teoria quântica de 


efeitos de transporte — condutividade térmica e elétrica. 


A aproximação de Bloch-Gruneissen para a resistência em um metal monovalente é 


-oT ~ zdz 
P= Eh ele) 


em que O é a temperatura de Debye característica do metal. 


(a) Para T — oo, mostre que 


ZC T 
PXT OZ 
(b) Para T — 0, mostre que 
T5 


Mostre que 


wf awo © [PEA co). 


2 a>1 0 x 


Pelo Exercício 5.9.6, ((2) = 72/6. Note que o integrando na parte (b) diverge para a = 1, mas que 


a série integrada é convergente. 
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5.9.11 A integral 1 sda 
[In(1 — x£) — 
0 x 
aparece na correção de quarta ordem do momento magnético do elétron. Mostre que ela é igual a 
26(3). 
Sugestão: Tome 1 — x = e™. 
5.9.12 Mostre que 
œ (Inz)? 1 1 1 
dz =4[1 Pops | 
1 142º pts 
Por integração de contorno (Exercício 7.1.17), pode-se mostrar que essa expressão é igual a 7° /8. 
5.9.13 Para valores “pequenos” de x, 
ln(z!) = —yx + Sarita, 
n=2 e 
em que y é a constante de Euler-Mascheroni e ¢(n) é a função zeta de Riemann. Para quais valores 
de x esta série converge? 
Resposta: —1 < x < 1. 
Note que se x = 1, obtemos 
c_n GU) 
n=2 a 
uma série para a constante de Euler-Mascheroni. A convergência dessa série é excessivamente lenta. 
Para o cálculo propriamente dito de y, há outras abordagens, indiretas, que são muito superiores 
(veja os Exercícios 5.10.11 e 8.5.16). 
5.9.14 | Mostre que a expansão da série de ln(x!) (Exercício 5.9.13) pode ser escrita como 
1 Ta + Cen 1) > 
In(x) = 1 Bar 
Cm date) 2 (2) Ei > M+1 ? 
1 TÈ 1 l+a 
b) ln(z!) = 1 l 1 
oreta 2 (E) 2 (E) + na 
SO 2n+1 
— 2 )-1 
2K e 
Determine a faixa de convergência de cada uma dessas expressões. 
5.9.15 Mostre que a constante de Catalan, 8(2), pode ser escrita como 
OO 5 n2 
2)=2 4k — 3) 4- —. 
B= k-37- T 
k=1 
Sugestão: n? = 6C (2). 
5.9.16 Derive as seguintes expansões das funções de Debye para n > 1: 
T dt 1 £ z Bopz?! 
Sgk |.) < 27; 
| gal" É aF D *L Tr mami Er 
© dt L afe nal m(n— Dat? n! 
/ a [+ k2 + k3 Pe nad 
4 k=1 
para x > 0. A integral completa (0, o0) é igual a n!¢(n + 1), Exercício 8.2.15. 
5.9.17 (a) Mostre que a equação ln 2 = 52 ,(—1)5t!s71! (Exercício 5.4.1) pode ser reescrita como 


s= 


2p 


= p=1 


m2= 552l) 4 3 Corra Te 


Sugestão: Considere os termos em pares. 
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(b) Calcule In 2 até cinco algarismos significativos. 


5.9.18 (a) Mostre que a equação 7/4 = 5 2 (—1)” t! (2n — 1)7! (Exercício 5.7.6) pode ser reescrita 


como 
o0 


T = —2s rane E É 
ria S(2s) = 2 > (dp) [H-a l 


(b) Calcule 7 /4 até seis algarismos significativos. 


5.9.19 Escreva um subprograma de função ZETA(N) para calcular a função zeta de Riemann para 
argumento inteiro. Tabule C(s) para s = 2,3,4,...,20. Verifique os valores que calculou pela 
Tabela 5.3 e AMS-55, Capítulo 23. (Veja o Exercício 5.2.22 para a referência. 
Sugestão: Se você fornecer o subprograma de função com os valores conhecidos Ç(2), (3), e (4), 
evitará as séries que convergem mais lentamente. O tempo de cálculo pode ser abreviado mais ainda 
usando-se a Equação (5.170). 

5.9.20 Calcule o logaritmo (base 10) de | Bən], n = 10,20,...,100. 
Sugestão: Programe C(n) como um subprograma de função, Exercício 5.9.19. 

Valores de verificação. log |Bi100| = 78,45 
log |Bo00| = 215, 56. 


5.10 Séries Assintóticas 

Séries assintóticas ocorrem com freqüência em física. Em cálculos numéricos elas são empregadas para o cálculo 
preciso de uma variedade de funções. Aqui consideramos dois tipos de integrais que levam a séries assintóticas: 
em primeiro lugar, uma integral da forma 


h= [ efa) du 


em que a variável x aparece como o limite inferior de uma integral. Em segundo lugar, consideramos a forma 


b(x) = J e=s(2) du, 


com a função f a ser expandida como uma série de Taylor (série binomial). Séries assintóticas ocorrem com 
freqüência como soluções de equações diferenciais. Um exemplo disso aparece na Seção 11.6 como uma solução 
da equação de Bessel. 


Função Gama Incompleta 
A natureza de uma série assintótica talvez seja mais bem ilustrada por um exemplo específico. Suponha que temos 
a função integral exponencial? 


Ei(o) = f Ei (5.174) 
pera 
ou Soa 

Ei( a= — du = Ei(a), (5.175) 


para ser avaliada para valores grandes de x. Ou vamos tomar uma generalização da função fatorial incompleta 
(função gama incompleta)? 


I(x,p) = J e “u? du =T(1 — p, <x), (5.176) 


na qual x e p são positivos. Novamente, procuramos avaliá-la para valores grandes de zx. 
Integrando por partes, obtemos 


I(x, p) = E -v f e` “u?! du 


xP 
e” e” e 
++ f etu du (5.177) 


23Essa função ocorre com freqüência em problemas de astrofísica que envolvem gases com distribuição de energia de Maxwell-Boltzmann. 
24Veja também a Seção 8.5. 
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Continuando a integrar por partes, desenvolvemos a série 


-ald p  pp+2) nı (p+n-2)! 
I(x,p)=e (= Es] + PT3 + (=1) Ijli 
— DD! [O 
+(-1)” e D ) / eu TP" du. (5.178) 
p— £ 
Essa é uma série notável. Verificando a convergência pelo teste da raiz de d’ Alembert, encontramos 
n ! 1 
ia a r PEDE oa MS (5.179) 
n>o00 [un | n>o00 (p+n— 1)! x£ n500 T 


para todos os valores finitos de x. Portanto, nossa série, por ser uma série infinita, diverge em todo lugar! Antes de 
descartar a Equação (5.178) como imprestável, vamos ver quão bem uma dada soma parcial se aproxima da função 
fatorial incompleta, I(x, p): 


I(x, p)— sn(x,p) = (1t etn)! T e` "u P="! du = R(x, p). (5.180) 


Em valor absoluto } 
+n)! [O 
|I(x, p) — sn(x,p)| < eiS e` “u P"! du. 


Quando substituímos u = v + x, a integral se torna 


OO oO 
/ ety rn du= ER e"(utra) Pol dw 
£ 0 


—p—n—1 
e” (0,0) v p—n 
—u 
= — — (o) 1 A dv. 
Ro J ( a: 


Para x grandes, a integral final se aproxima de 1 e 


+n)! et 
(2,7) — sn(x,p)| = e PRE (5.181) 


Isso significa que, se tomarmos x suficientemente grande, nossa soma parcial s, é uma aproximação 
arbitrariamente boa para a função da I(x, p). Portanto, nossa série divergente (Equação (5.178)) é perfeitamente 
boa para cálculos de somas parciais. Por essa razão, ela costuma ser denominada série semiconvergente. Note que 
a potência de x no denominador do resto (p + n + 1) é mais alta do que a potência de x no último termo incluído 
em sn(x,p), (p+ n). 

Uma vez que o sinal do resto R, (x, p) se alterna, as somas parciais sucessivas dão, alternativamente, limites 
superiores e inferiores para I(x, p). O comportamento da série (com p = 1) como uma função do número de 
termos incluídos é mostrado na Figura 5.12. Temos 


1 11 2 3! non! 
E 2 2 + +(=1) qr? 


(5.182) 


z£ £ xt 


que é avaliada em x = 5. A determinação ótima de e” E; (x) é dada pela melhor aproximação dos limites superiores 
e inferiores, isto é, entre s4 = sẹ = 0, 1664 e s5 = 0, 1741 para x = 5. Portanto, 


0,1664 < e” Ei (x)| _; < 0,1741. (5.183) 


Na verdade, pelas tabelas, 
Elm). = 0, 1704, (5.184) 


dentro dos limites estabelecidos por nossa expansão assintótica. Note que a inclusão de termos adicionais na 
expansão da série além do ponto ótimo literalmente reduz a precisão da representação. À medida que x aumenta, 
a amplitude entre o limite superior e o limite inferior diminui. Considerando x suficientemente grande, podemos 
calcular e” Ei (a) para qualquer grau de precisão. Outras propriedades de E1(x) são derivadas e discutidas na 
Seção 8.5. 
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08H 


0.1704 0,1714 


0,1664 


o5F 


0314F 


Figura 5.12: Somas parciais de e” E: (2º) |p=5. 


Integrais de Seno e Co-seno 


Séries assintóticas também podem ser desenvolvidas a partir de integrais definidas se o integrando tiver o 
comportamento requerido. Como exemplo, as integrais de seno e co-seno (Seção 8.5) são definidas por 


0 st 

Ci(a) = -f at, (5.185) 
oe t 

si(x) = — i - dt. (5.186) 


Combinando essas integrais com funções trigonométricas regulares, podemos definir 


. ; ®© sen y 
x) = Ci(x)sen x — si(x) cos z = dy, 
fa) = Cile) (a)cose= [ Lay 
(5.187) 
g(x) = —Ci(x) cosa — si(x)sen x = i y Y, 
o Y+T 
com a nova variável y = t — x. Partindo para variáveis complexas, Seção 6.1, temos 
(x) +if(x) do a | a (5.188) 
x) +if(a) = E u, . 
! o ytz ” o l+iu 
na qual u = —iy/x. Os limites de integração, O a oo, em vez de O a —ioo, podem ser justificados pelo teorema de 
Cauchy, Seção 6.3. Racionalizando o denominador e igualando parte real com parte imaginária, obtemos 
(0,0) ue tY jo.) e77 
= —— d = — du. 5.189 
sf ado tof Et (5.180) 


Para convergência das integrais devemos exigir que R(x) > 0. 
Agora, para desenvolver as expansões assintóticas, seja v = xu e expanda o fator precedente [1 + (v/x)2]1 


25 R(x) = parte real de x (complexo), (compare com Seção 6.1). 
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pelo teorema binomial.?é Temos 
1 EE —u au 1 n (2n)! 
Ha) = F e™ 3 (61) mb = an (5.190) 
0<n<N 0<n<N 
RR ico avet 1 n(2n + 1)! 
tda) Devia O rãs 
0 0<n<N 0<n<N 


. sen q n(2n)! cosg n(2n+ 1)! 
Ci(r) = DD (=1) 2n 22 >D (=1) gn 
T o<n<N E 0<n<N 
(em)! (en 41! (5.191) 
A cos x n(n): seng n (2n + 1): 
EE e a a 
0<n<N 0<n<N 


são as expansões assintóticas desejadas. 

Essa técnica de expandir o integrando de uma integral definida e integrar termo a termo é aplicada na Seção 11.6, 
para desenvolver uma expansão assintótica da função de Bessel modificada K,, e na Seção 13.5, para expansões 
das duas funções hipergeométricas confluentes M (a, c; x) e U (a, c; x). 


Definição de Série Assintótica 


O comportamento dessas séries (Equações (5.178) e (5.191)) é consistente com as propriedades que definem uma 


série assintótica.” Conforme Poincaré, consideramos?’ 
q" Rn(x:) = 2º [f (£) — sn(2)], (5.192) 
em que 
a a An 
sm)=0+t>+5+ +=. (5.193) 
É £ 


A expansão assintótica de f(x) tem as seguintes propriedades 


lim z” Ra(x) = 0, para n fixo, (5.194) 
e 
lim z” Ra(x) = 00, para z fixo 2? (5.195) 


Veja as Equações (5.178) e (5.179) para um exemplo dessas propriedades. Para a série de potências, como 
admitimos na forma de sn (x), Rn(x) ~ a” "1. Com as condições (5.194) e (5.195) satisfeitas, escrevemos, 


FE) ao ™. (5.196) 
n=0 


Note a utilização de = no lugar de =. A função f(x) é igual à série somente no limite à medida que x — oo e para 
número finito de termos na série. 

Expansões assintóticas de duas funções podem ser multiplicadas, e o resultado será uma expansão assintótica 
do produto das duas funções. 

A expansão assintótica de uma dada função f(t) pode ser integrada termo a termo (exatamente como em uma 
série uniformemente convergente de funções contínuas) x < t < co, e o resultado será uma expansão assintótica 


% Essa etapa é válida para v < x. As contribuições de v > x serão desprezíveis (para x grande) por causa da exponencial negativa. É porque 
a expansão binomial não converge para v > x que nossa série final é assintótica em vez de convergente. 

27 Não é necessário que a série assintótica seja uma série de potências. A propriedade exigida é que o resto Rn (x) seja de ordem mais alta 
do que o último termo mantido — como na Equação (5.194). 

28A definição de Poincaré permite (ou despreza) funções exponencialmente decrescentes. O refinamento da definição de Poincaré é de 
considerável importância para a teoria avançada de expansões assintóticas, em particular para extensões para o plano complexo. Todavia, para a 
finalidade de um tratamento introdutório, e em especial para cálculo numérico com < real e positivo, a abordagem de Poincaré é perfeitamente 
satisfatória. 

Isso exclui a série convergente de potências inversas de x. Alguns autores acham que essa exclusão é artificial e desnecessária. 
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de f xa f(t) dt. Contudo, a diferenciação termo a termo é válida somente sob condições muito especiais. 

Algumas funções não possuem uma expansão assintótica; e” é um exemplo de uma função dessas. Todavia, 
se uma função tiver uma expansão assintótica, tem somente uma. A correspondência não é um para um; muitas 
funções têm a mesma expansão assintótica. 

Um dos métodos mais úteis e poderosos para gerar expansões assintóticas, o método dos declínios mais 
acentuados, será desenvolvido na Seção 7.3. Entre as aplicações estão a derivação da fórmula de Stirling para 
a função fatorial (completa, Seção 8.3) e as formas assintóticas das várias funções de Bessel (Seção 11.6). Séries 
assintóticas ocorrem com razoável freqiiência na física matemática. Uma das aproximações mais antigas, e ainda 
importante da mecânica quântica, a expansão WKB, é uma série assintótica. 


Exercícios 
5.10.1 A fórmula de Stirling para o logaritmo da função fatorial 


N 


1 1 
ln(z!) = Emt GE ) lng = 25 one D ql, 


Os Bən são os números de Bernoulli (Seção 5.9). Mostre que a fórmula de Stirling é uma expansão 
assintótica. 


5.10.2 | Integrando por partes, desenvolva expansões assintóticas das integrais de Fresnel. 
x 2 


(a) C(x) = 1 cos M du, (b) s(x) = J sen => du. 
Essas ilegais aparecem na análise de um padrão de difração em gume de faca. 

5.10.3 Derive novamente as expansões assintóticas de Ci(x) e si(x) por repetida integração por partes. 
Sugestão: Ci(a) + isi(x) = — [º E dt. 

5.10.4 Derive a expansão assintótica da função de erro de Gauss 


gi = qb 


po 1-3 1-3-5 (2n— 1)! 
Šri 1 RR E a 
cf 2x? a 22q4 2398 ELEN 2ng2n ) 
Sugestão: erf (x) = 1 — erfe(x) = 1 — + dedo 


Essa função, quando normalizada de ea que = E o = 1, desempenha um importante papel na 
teoria da probabilidade. Ela pode ser expressa em termos das integrais de Fresnel (Exercício 5.10.2), 
das funções gama incompletas (Seção 8.5) e das funções hipergeométricas confluentes (Seção 13.5). 


5.10.5 As expressões assintóticas para as várias funções de Bessel, Seção 11.6, contêm as séries 


ir — (2s — 1) 
fa Ha Mer 


PR É — (2s — 1)? 
Quiz) ~ = 1+ (2n — 1)!(82)2r-1 


n=1 


Mostre que essas duas séries são, de fato, séries assintóticas. 


5.10.6 Para x > 1, 
l+% = pulei) "= 


Teste essa série para ver se ela é uma série assintótica. 


5.10.7 Derive as seguintes séries assintóticas de números de Bernoulli para a constante de Euler- 


Mascheroni: 
N 


da B 
= e "aliia q Bin 


Sugestão: Aplique a fórmula de integração de Euler-Maclaurin a f(x) = x 
[1, n] para N = 1,2,... 


sobre o intervalo 
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5.10.8 Desenvolva uma série assintótica para 


i gre” (1 + v)? dv. 
0 


Considere zx real e positivo. 


Ba y DEl 


1 
Resposta: . 
P x£ r3 xo g2n+1 


5.10.9 Calcule somas parciais de e” E(x) para x = 5,10 15 para exibir o comportamento demonstrado 
na Figura 5.11. Determine a largura do “gargalo” para x = 10 e 15, análogo à Equação (5.183). 
Resposta: Largura do “gargalo”: n = 10; 0,000051 
n = 15; 0,0000002. 


5.10.10 O padrão de difração em gume de faca é descrito por 
I = 0,5I0{ [C(uo) +0,5]” + [S(uo) +0,51°}, 


em que C(uo) e S(uo) são as integrais de Fresnel do Exercício 5.10.2. Aqui, To é a intensidade 
incidente e 1 é a intensidade difratada; uo é proporcional à distância de afastamento do gume de 
faca (medida em ângulo reto em relação ao raio incidente). Calcule I /To para uo, variando de —1, 0 
a +4,0 em passos de 0,1. Tabule os resultados obtidos e, se dispuser de uma rotina de plotagem, 
construa um gráfico com esses resultados. 


Valor de verificação. uo = 1,0, I /Io = 1,259226. 
5.10.11 A fórmula de integração de Euler-Maclaurin da Seção 5.9 fornece um modo para calcular a 


constante y de Euler-Mascheroni com alta precisão. Usando f(x) = 1/x na Equação (5.168b) 
(com intervalo [1, n]) e a definição de y da (Equação 5.28), obtemos 


Ee ia aa 
x = 2n a (2k)n2k ` 


Usando aritmética de dupla precisão, calcule y para N = 1,2,... 
Nota: D. E. Knuth, Constante de Euler até 1271 casas decimais. Math. Comput. 16: 275 (1962). Um 
cálculo ainda mais preciso aparece no Exercício 8.5.16. 
Resposta: Para n = 1000, N = 2 
y = 0,5772 1566 4901. 


5.11 Produtos Infinitos 


Considere uma sucessão de fatores positivos f1- f2- f3- fa- fn(fi > 0). Usando (T |) para indicar produto, assim 
como sigma maiúsculo (S) indica uma soma, temos 


did (5.197) 
i=1 
Definimos pn, um produto parcial, por analogia com s, a soma parcial, 
Pn = i fi (5.198) 
i=1 
e então investigamos o limite 
im Pn = P. (5.199) 


Se P é finito (mas não zero), dizemos que o produto infinito é convergente. Se P é infinito ou zero, o produto 
infinito é denominado divergente. 
Uma vez que o produto divergirá até o infinito se 


lim f,>1 (5.200) 
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ou até zero para 
lim f,<1 (and > 0), (5.201) 


é conveniente escrever nossos produtos infinitos como 


[a + am). 


então, a condição an — 0 é uma condição necessária (mas não suficiente) para convergência. 
O produto infinito pode ser relacionado com uma série infinita pelo método óbvio de considerar o logaritmo 


n [ [0+ an) = X nA + an). (5.202) 
n=1 n=1 


Uma relação mais útil é estabelecida pelo teorema que vem a seguir. 


Convergência de Produto Infinito 
Se 0 < a, < 1, os produtos infinitos [= ,(1+a,) e J [X (1 — an) convergem se 517º, an convergir e divergem 
se $>] an divergir. 

Considerando o termo 1 + an, vemos pela Equação (5.90) que 


l+a, < e”. (5.203) 
Por conseguinte, para o produto parcial p,, sendo Sn a soma parcial dos a;, 
Pn Se, (5.204) 


e, deixando que n — œ, 


Ia +an) < as an, (5.205) 
n=1 


n=1 


estabelecendo assim um limite superior para o produto infinito. 
Para desenvolver um limite inferior, notamos que 


READ ES as am (5.206) 


uma vez que a; > 0. Por conseguinte, 
[a+a)>> an. (5.207) 
n=1 n=1 


Se a soma infinita permanecer finita, o produto infinito também permanecerá. Se a soma infinita divergir, o produto 
infinito também divergirá. 

O caso de T](1 — an) é complicado pelos sinais negativos, mas pode-se desenvolver uma prova que depende da 
prova antecedente, notando que, para a, < 5 (lembre-se de a, — 0 para convergência), 


A-a)j<(ra) 


(1— an) > (1 + 2an). (5.208) 


Seno, Co-seno, Funções Gama 
Um polinômio de enésima ordem P, (x) com n raízes reais pode ser escrito como um produto de n fatores (veja a 
Seção 6.4, teorema fundamental de Gauss da álgebra): 


Pala) = (x — x1)(£ — 22): (£ — £n) = [ [© — xi). (5.209) 


i=l 
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Desse mesmo modo, podemos esperar que uma função com um número infinito de raízes possa ser escrita como 
um produto infinito, um fator para cada raiz. E, de fato, é isso que acontece em funções trigonométricas. Temos 
duas representações de produto infinito muito úteis, 


oO r2 
= l-Ss 21 
sen x -II( da). (5.210) 
sea 4r? 
n=1 


A derivação mais conveniente e talvez a mais elegante dessas duas expressões resulta da utilização de variáveis 
complexas.3? Por nosso teorema de convergência, Equações (5.210) e (5.211) são convergentes para todos os 
valores finitos de x. Especificamente, para o produto infinito para sen x, a, = £? /n2r?, 


[e0] 2 OO 2 2 
T —2 T x 
n=1 n=1 


pelo Exercício 5.9.6. A série correspondente à Equação (5.211) se comporta de maneira semelhante. 
A Equação (5.210) leva a dois resultados interessantes. Primeiro, se estabelecermos x = 7/2, obtemos 


sf) SE] sam 


n=1 n=1 


Resolvendo para 7/2, temos 


ETI (2n)? = 2:2 4-4 66 
E a 35 Ba P? (5.214) 


que é a famosa fórmula de Wallis para 7/2. 
O segundo resultado envolve a função gama ou função fatorial (Seção 8.1). Uma definição da função gama é 


= >i 
T(a) = o II (1 a Deer] , (5.215) 


r=1 


em que é a constante de Euler-Mascheroni usual (compare com a Seção 5.2). Se considerarmos o produto de 
T(x) e D(—«), a Equação (5.215) leva a 
—1 


rarega fe” Il (1 z Jetro II ( E Ser 


r=1 r=1 
bera q2N T! 
=-1 (1 3 z) | (5216) 
r=1 
Usando a Equação (5.210) com x substituído por mx, obtemos 
T 

Tr(x)I = ; 5.217 
RS TSEN TT ( ) 


Antecipando uma relação de recorrência desenvolvida na Seção 8.1, temos —a«M(—x) = T(1 — x). A Equação 
(5.217) pode ser escrita como 


T. 


TT — x) = (5.218) 


sen 7% 


Isso será útil no tratamento da função gama (Capítulo 8). 

Em termos estritos, deveríamos verificar a faixa de x para a qual a Equação (5.215) é convergente. Fica claro 
que fatores individuais desaparecerão para x = 0, —1, —2,... Deixamos para o Exercício 5.11.9 a prova de que o 
produto infinito converge para todos os outros valores (finitos) de x. 

Esses produtos infinitos têm uma variedade de usos na matemática. Contudo, por causa da convergência bastante 
lenta, não são adequados para trabalho numérico de precisão em física. 


30 Veja as Equações (7.25) e (7.26). 
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5.11.1 


5.11.2 


5.11.3 


5.11.4 


5.11.5 


5.11.6 


5.11.7 


5.11.8 


5.11.9 


5.11.10 


Usando 


In Fa + Qu) = 5 ln(1 an) 


e a expansão de Maclaurin de In(1 + a„), mostre que o produto infinito J [7_; (1 + an) converge 
ou diverge com a série infinita 57, an- 


Um produto infinito aparece na forma 


i (: +a/ z) 
b) 
ai \l+b/n 
em que a e b são constantes. Mostre que esse produto infinito converge somente se a = b. 


Mostre que as representações de produto infinito de sen x e cos x são consistentes com a identidade 
2sen z cos x = sen 27. 


Determine o limite para o qual 


n=2 
converge. 
Mostre que 
fi-en] 
n n(n + 1) 3 
Prove que 


Verifique a identidade de Euler 


[(1+ 2) = E k| <1. 


ksi 
ll 
= 

Q 
Il 
pa 


Mostre que J [?2; (1 + z/r)e7?/" converge para todo « finito (exceto para os zeros de 1 + x/r). 
Sugestão: Escreva o enésimo fator como 1 + a,. 

Calcule cosx a partir de sua representação de produto infinito, Equação (5.211), usando (a) 10, 
(b) 100 e (c) 1.000 fatores no produto. Calcule o erro absoluto. Note quão lentamente os produtos 
parciais convergem — tornando o produto infinito bastante inadequado para trabalho numérico de 
precisão. 


Resposta: Para 1.000 fatores, cos m = —1, 00051. 
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e para séries de Fourier. 


“livro” — 2007/81 — 15:06 — page 305 — #315 


6 


Funções de uma Variável Complexa I 
Propriedades Analíticas, Mapeamento 


Os números imaginários são um vôo maravilhoso do espírito divino; 
são quase um anfíbio entre ser e não ser. 


GOTTFRIED WILHELM VON LEIBNIZ, 1702 


Agora passamos ao estudo de uma variável complexa. Nessa área desenvolveremos algumas das ferramentas 
mais poderosas e de utilização mais ampla em toda a análise. Para mostrar, ao menos parcialmente, por que 
variáveis complexas são importantes, mencionamos brevemente diversas áreas de aplicação. 

1. Para muitos pares de funções u e v, u e v satisfazem a equação de Laplace 


92 W(a, y) & Opa, y) 


DES 
pipes Ox? Oy? 


=0. 


Por conseguinte, qualquer delas, u ou v, pode ser usada para descrever um potencial eletrostático bidimensional. 
A outra função, que dá uma família de curvas ortogonais às da primeira função, pode então ser usada para 
descrever o campo elétrico E. Uma situação semelhante ocorre na hidrodinâmica de um fluido ideal em movimento 
irrotacional. A função u poderia descrever o potencial de velocidade, enquanto a função v seria então a função 
corrente. 

Em muitos casos nos quais as funções u e v são desconhecidas, mapeamento ou transformação no plano 
complexo nos permite criar um sistema de coordenadas ajustado ao problema particular. 

2. No Capítulo 9 veremos que as equações diferenciais de segunda ordem de interesse para a física podem ser 
resolvidas por séries de potências. Essas mesmas séries podem ser usadas no plano complexo para substituir x pela 
variável complexa z. A dependência da solução f(z) em um dado 29 do comportamento de f(z) em outro lugar 
nos dá uma idéia melhor do comportamento de nossa solução e uma poderosa ferramenta (continuação analítica) 
para ampliar a região na qual a solução é válida. 

3. A mudança de um parâmetro k de real para imaginário, k — ik, transforma a equação de Helmholtz na 
equação de difusão. A mesma mudança transforma as soluções da equação de Helmholtz (funções de Bessel e 
funções esféricas de Bessel) nas soluções da equação de difusão (funções de Bessel modificadas e funções de 
Bessel esféricas modificadas). 

4. Integrais no plano complexo têm uma ampla variedade de aplicações úteis: 

Avaliação de integrais definidas; 

Inversão de séries de potências; 

Formação de produtos infinitos; 

Obtenção de soluções de equações diferenciais para grandes valores da variável (soluções assintóticas); 
Investigação da estabilidade de sistemas potencialmente oscilantes; 

Inversão de transformadas integrais. 


5. Muitas quantidades físicas que originalmente eram reais tornam-se complexas, assim como uma teoria física 
simples torna-se geral. O índice de refração real da luz torna-se uma quantidade complexa quando é incluída a 
absorção. A energia real associada com um nível de energia torna-se complexa quando o tempo finito de vida do 
nível é considerado. 
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6.1 Álgebra Complexa 


Um número complexo nada mais é do que um par ordenado de dois números reais, (a,b). De modo semelhante, 
uma variável complexa é um par ordenado de duas variáveis reais, ! 


z = (x,y). (6.1) 


A ordem é significativa. Em geral (a, b) não é igual a (b, a) e (x, y) não é igual a (y, x). Como sempre, continuamos 
a escrever um numero real (x, 0) simplesmente como zv, e denominamos à = (0, 1) a unidade imaginária. 

Toda a nossa análise de variável complexa pode ser desenvolvida em termos de pares ordenados de números 
(a,b), variáveis (x, y) e funções (u(x, y), v(x,y)). 

Agora, definimos adição de números complexos em termos de suas componentes cartesianas como 


z1 + 22 = (£1, Y1) + (£2, Y2) = (£1 + £2, Y1 + Y2), (6.2a) 


isto é, adição vetorial bidimensional. No Capítulo 1, os pontos no plano xy são identificados com o vetor de 
deslocamento bidimensional r = x + Yy. O resultado disso é que vetores bidimensionais análogos podem ser 
desenvolvidos para grande parte de nossa análise complexa. O Exercício 6.1.2 é um exemplo simples; o teorema 
da Cauchy, Seção 6.3, é outro. 

Multiplicação de números complexos é definida como 


z122 = (£1, Y1) ` (£2, Y2) = (£1£2 — Y1Y2, T1Y2 + voy). (6.2b) 


Usando a Equação (6.2b), verificamos que ¿? = (0,1) - (0,1) = (—1,0) = —1, portanto, também podemos 
identificar à = y —1, como sempre, e então reescrever a Equação (6.1) como 


z = (x,y) = (x,0) + (0, y) = x + (0,1) - (y,0) = z + iy. (6.2c) 


E claro que o i não é necessário aqui, mas é conveniente. Ele serve para manter pares em ordem — parecido com 
os vetores unitários do Capítulo 1.2 


Permanência da Forma Algébrica 


Todas as nossas funções elementares, e?, sen z, e assim por diante, podem ser estendidas para o plano complexo 
(compare com o Exercício 6.1.9). Por exemplo, elas podem ser definidas por expansões de série de potências, tal 
como 


z 2 X gz” 
En e (6.3) 


para a exponencial. Tais definições estão de acordo com as definições de variável real ao longo do eixo x real 
e estendem as funções reais correspondentes para o plano complexo. Esse resultado costuma ser chamado de 
permanência da forma algébrica claro. 

É conveniente empregar uma representação gráfica da variável complexa. Plotando x — a parte real de z — 
como a abscissa e y — a parte imaginária de z — como a ordenada, temos o plano complexo, ou plano de Argand, 
mostrado na Figura 6.1. Se atribuirmos valores específicos a x e y, então z corresponde a um ponto (x, y) no plano. 
Em termos da ordenação mencionada antes, é óbvio que o ponto (x, y) não coincide com o ponto (y, x) exceto no 
caso especial de x = y. Além do mais, podemos escrever, pela Figura 6.1, 


x =rcoso0, y = rsen 6 (6.4a) 


z = r(cos 0 + isen 0). (6.4b) 


"É exatamente assim que um computador executa aritmética complexa. 
2A álgebra de números complexos, (a, b), é isomórfica com a álgebra de matrizes da forma 


(compare com o Exercício 3.2.4). 
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Figura 6.1: Plano complexo — diagrama de Argand. 


Usando um resultado sugerido (mas não provado com rigor) ? pela Seção 5.6 e o Exercício 5.6.1, temos a útil 
representação polar 


z = r(cos 0 + isend) = re”. (6.4c) 


Para provar essa identidade, usamos if = —i, if = 1,... na expansão de Taylor das funções exponenciais e 


trigonométricas e separamos potências pares e ímpares em 


iw No GO GO S Gi) 
É E n! És Qv)! Es (2v +) 
p2r+1 
-5o E ATO Era = cos 0 + isen 0. 
Para os valores especiais 0 = 7/2 e 6 = 7, obtemos 
e7/2 = cos 5 + isens ME e” = cos(r) = —1, 


conexões intrigantes entre e, i e 7. Além do mais, a função exponencial et? é periódica com período 27, exatamente 
como sen f e cos 6. 

Nessa representação r é denominado módulo ou grandeza de z (r = |z| = (x? + y))!/2) e o ângulo 
0 (tg !(y/x)) é denominado o argumento ou fase de z. (Note que a função arco tangente tg !(w/x) tem 
infinitamente muitos ramos.) 

A escolha de representação polar, Equação (6.4c), ou representação cartesiana, Equações (6.1) e (6.2c), é uma 
questão de conveniência. Adição e subtração de variáveis complexas são mais fáceis na representação cartesiana, 
Equação (6.24). Multiplicação, divisão, potências e raízes são mais fáceis de tratar em forma polar, Equação (6.4c). 

Seja analítica ou graficamente, usando a analogia com vetores, podemos mostrar que o módulo da soma de dois 
números complexos não é maior do que a soma dos módulos e não é menor do que a diferença, Exercício 6.1.3, 


Jz] — lz2| < lz1 + 29] < jz] + lz2l. (6.5) 


Por causa da analogia vetorial, essas desigualdades são denominadas triangulares. 
Usando a forma polar, Equação (6.4c), constatamos que a grandeza de um produto é o produto das grandezas: 


|z ; zal = jz1| E [za]. (6.6) 


Além disso, 
arg(z1 - 22) = arg 2) + arg z2. (6.7) 


3Em termos estritos, o Capítulo 5 limitou-se às variáveis reais. O desenvolvimento de expansões de séries de potências para funções 
complexas é retomado na Seção 6.5 (expansão de Laurent). 
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Por meio de nossa variável complexa z, podemos construir funções complexas f(z) ou w(z). Então, essas 
funções complexas podem ser resolvidas para partes real e imaginária, 


w(z) = u(x, y) + iv(x, y), (6.8) 
nas quais as funções separadas u(x, y) e v(x, y) são reais puras. Por exemplo, se f(z) = 2°, temos 
He) = (z + iy)? = (2? — y’) + i2xy. 


A parte real de uma função f(z) será representada por R f(z), ao passo que a parte imaginária será representada 
por S f(z). Na Equação (6.8) 


Rw(z) = Re(w) = ulz, y), Sw(z) = Im(w) = v(x, y). 

A relação entre a variável independente z e a variável dependente w talvez seja mais bem retratada como uma 
operação de mapeamento. Um z = « + iy dado significa um ponto no plano z. Então, o valor complexo de w(z) é 
um ponto no plano w. Pontos no plano z são mapeados nos pontos no plano w e curvas no plano z são mapeadas 
curvas no plano w, como indicado na Figura 6.2. 


yA vA 


Plano z Plinio 


1 


Figura 6.2: A função w(z) = u(x, y) + iv(x,y) mapeia pontos no plano xy para pontos no plano uv. 


Conjugação Complexa 
Em todas essas etapas, número complexo, variável complexa e função complexa, a operação de substituição de i 
por —i é denominada “tomar o complexo conjugado”. O complexo conjugado de z é denotado por z2*, em que? 


69) 


A variável complexa z e seu complexo conjugado z* são imagens especulares uma da outra refletidas no eixo 
x, isto é, inversão do eixo y (compare com a Figura 6.3). O produto zz* leva a 


y 


(x, y) 


ei x, —y) 


Figura 6.3: Pontos complexos conjugados. 


40 complexo conjugado costuma ser denotado por Z na literatura matemática. 
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zz* = (z + iy)(x — iy) = 2? +y =r. (6.10) 


Por conseguinte, 


a grandeza de z. 


Funções de uma Variável Complexa 

Todas as funções elementares de variáveis reais podem ser estendidas para o plano complexo-substituindo a 
variável real x pela variável complexa z. Isso é um exemplo da continuação analítica mencionada na Seção 6.5. 
A relação de extrema importância da Equação (6.4c) é uma ilustração. Passar para o plano complexo abre novas 
oportunidades para análise. 


Exemplo 6.1.1 FÓRMULA DE DE MOIVRE 


Se a Equação (6.4c) (estabelecendo r = 1) for elevada à enésima potência, temos 
er? = (cos 0 + isen 0)”. (6.11) 
Expandindo a exponencial, agora com argumento nf, obtemos 
cos n0 + isen nô = (cos O + isen 0)”. (6.12) 


A fórmula de De Moivre é gerada se o lado direito da Equação (6.12) for expandido pelo teorema binomial; 
obtemos cos n como uma série de potências de cos 0 e sen 0, Exercício 6.1.6. 


Numerosos outros exemplos de relações entre as funções exponenciais, hiperbólicas e trigonométricas no plano 
complexo aparecem nos exercícios. 

Ocasionalmente há complicações. O logaritmo de uma variável complexa pode ser expandido usando a 
representação polar 


lnz = Inre”? = lnr + ið. (6.13a) 


Isso não está completo. No que tange ao ângulo de fase, 0, podemos adicionar qualquer inteiro múltiplo de 27 sem 
alterar z. Daí, a Equação (6.13a) deve ser 


In z = Inri) — Inr + i(o + 2n7). (6.13b) 


O parâmetro n pode ser qualquer inteiro, o que significa que ln z é uma função de valores múltiplos que tem 
um número infinito de valores para um único par de valores reais r e 0. Para evitar ambigüidade, a escolha mais 
simples é n = 0 e limitar a fase a um intervalo de comprimento 27, tal como (—7,7).> A reta no plano z que 
não é cruzada, nesse caso o eixo real negativo, é denominada linha de corte ou corte de ramo. O valor de In z 
com n = () é denominado valor principal de In z. Uma discussão mais detalhada dessas funções, incluindo o 
logaritmo, aparece na Seção 6.7. 


Exercícios 
6.1.1 (a) Ache a recíproca de x + ty, trabalhando inteiramente na representação cartesiana. 
(b) Repita a parte (a) trabalhando em forma polar, mas expressando o resultado em forma 
cartesiana. 
6.1.2 As quantidades complexas a = u + iv e b = x + iy também podem ser representadas como vetores 


bidimensionais a = Xu + yv, b = Xa + yy. Mostre que 


ab=a-b+izZz.axb. 


Não há nenhum padrão para a escolha de fase; a fase adequada depende de cada problema. 
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6.1.3 Prove algebricamente que, para números complexos, 
lzi] — [22] < [z1 + 20] < [z1] + [22l 


Interprete esse resultado em termos de vetores bidimensionais. Prove que 


lz-1|<|V2-1|<l|z+1], para R(z) >0. 
6.1.4 Podemos definir um operador de conjugação complexa K, tal que Kz = z*. Mostre que K não é 
um operador linear. 


6.1.5 Mostre que números complexos têm raízes quadradas e que as raízes quadradas estão contidas no 
plano complexo. Quais são as raízes quadradas de i? 


6.1.6 Mostre que 

(a) cosn = cos” 0 — (3) cos”? Osen? + (4) cos" 4 Bsentg — -... 

(b) sen nð = (17) cos"! Asen 6 — (3) cos"-3 sendo +... 

Nota: As quantidades (77, ) são coeficientes binomiais: (14) = n!/[(n — m)!m!]. 
6.1.7 Prove que 


N-1 
Nax/2 
(a) > cosmo = =, ) eos(N 5. 


N-1 
(b) 5 sen ng = “2 GER sen (N D 
n=0 


Essas séries ocorrem na análise do padrão de difração de fenda múltipla. Uma outra aplicação é a 
análise do fenômeno de Gibbs, Seção 14.5. 

Sugestão: As partes (a) e (b) podem ser combinadas para formar uma série geométrica (compare 
com a Seção a 5.1). 


6.1.8 Para —1 < p < 1, prove que 


(0,0) 
1 — pcos x 
a P cosnt = — s, 
(a) 2» 1 — 2p cos x + p? 
= psen x 
b sen ng = — ~. 
o 2 1 — 2p cos x + p? 


Essas séries ocorrem na teoria do interferômetro de Fabry-Perot. 


6.1.9 Admita que as funções trigonométricas e as funções hiperbólicas são definidas para argumento 
complexo pela série de potências adequada. 


eo ( n/2 ar oo z2s+1 
= =f n= — => =f TESES 
sen z D ( ) n! El ) (2s +1)! 
n=1, ímpar s=0 
o9: n ao 2s 
di ax n/22 LE Ns Z 
csz= 53 (-1) i =5 (1) Bo 
n=0, par s=0 
oo z” oo g28+1 
h = = 
S 2 n! (2s + DP 
n=1, ímpar s=0 
gn eu 228 
coshz= 5, O DD 
n=0, par 0 
(a) Mostre que 
isen z = senh iz, sen iz = isenh z, 
cos z = coshiz, cos iz = cosh z. 


(b) Verifique que relações funcionais familiares, tais como 


cosh z = 


A A 
2 , 


sen(z1 + 22) = sen 2; cos Z2 + sen zo cos 71, 
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6.1.10 


6.1.11 


6.1.12 


6.1.13 
6.1.14 


6.1.15 


6.1.16 


6.1.17 


6.1.18 


6.1.19 


ainda serão válidas no plano complexo. 
Usando as identidades 
e7” + ETZ e7 o ETZ 
cos z = ———, sen z = ————, 


2 


estabelecidas por comparação de séries de potências, mostre que 


(a) sen(x + iy) = sen z cosh y + i cos zsenh y, 


cos(x + iy) = cos z cosh y — isen asenh y, 
(b) |sen z|? = sen2x + senh?y, | cos z|? = cos? z + senh?y. 
Isso demonstra que podemos ter |sen z|, | cos z| > 1 no plano complexo. 
Pelas identidades nos Exercícios 6.1.9 e 6.1.10, mostre que 


(a) senh(x + iy) = senh z cos y + i cosh zsen y, 


cosh(a + iy) = cosh z cos y + isenh xseny, 


(b) |senh z|? = senh?x + sen?y, | cosh z|? = cosh? x + sen?y. 
Prove que 
(a) |sen z| > |sen z| (b) | cos z| > | cosa]. 


Mostre que a função exponencial e? é periódica com um período imaginário puro de 271. 


Mostre que 

z senha + iseny z senha-—iseny 

t = ; b) t = ; 
(a) I3 coha+ cos y b) I3 cosh x — cos y 
Ache todos os zeros de 
(a) sen z, (b) cos z, (c) senh z, (d) cosh z. 
Mostre que 
(a) sen 1z = —iln(iz +v1-22 ), (d) senh tz = ln(z +yz? +1 ), 


(b) cos! z = =iln(z + vyz? — 1), (e) cosh™! z = In(z + V22 — 1); 
otz= sn (5), Otorte= sim (TES), 


2 i—z l-z 
Sugestão: 1. Expresse as funções trigonométrica e hiperbólica em termos de exponenciais. 
2. Resolva para a exponencial e então para o expoente. 


Na teoria quântica da fotoionização, encontramos a identidade 


; ib 
ia— 1 4 
(x T z) = exp(—2b cot a), 


na qual a e b são reais. Verifique essa identidade. 


Uma onda de luz plana de freqüência angular w é representada por 


ett (t=na/c) } 


Em uma certa substância, o índice real simples de refração n é substituído pela quantidade complexa 
n — ik. Qual é o efeito de k sobre a onda? A que k corresponde em termos físicos? A generalização 
de uma quantidade da forma real para a forma complexa ocorre com freqüência na física. Exemplos 
abrangem desde o módulo complexo de Young de materiais viscoelásticos até o potencial (óptico) 
complexo da “bola de cristal nublada” do modelo do núcleo atômico. 


Vemos que, para as componentes do momento angular definidas no Exercício 2.5.14, 
Ly — iLy + (Le + il)”. 


Explique por que isso ocorre. 
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6.1.20 Mostre que a fase de f(z) = u + iv é igual à parte imaginária do logaritmo de f(z). O 
Exercício 8.2.13 depende desse resultado. 


6.1.21 (a) Mostre que el” Z é sempre igual a z. 
(b) Mostre que In e” nem sempre é igual a z. 


6.1.22 As representações de produto infinito da Seção 5.11 são válidas quando a variável real x é 
substituída pela variável complexa z. A partir dessa afirmativa, desenvolva representações de 
produto infinito para 
(a) senh z, (b) cosh z. 


6.1.23 A equação de movimento de uma massa m em relação a um sistema de coordenadas em rotação 


é 
d? d d 
mig =P mox wx) -mw F) -m(Sê xr). 


Considere o caso F = 0,r = x + y, e w = wZ, com w constante. Mostre que a substituição de 
r= x + y by z = x + iy leva a 
des 


d 
CO ad md: 


dt? dt 


Nota: Essa equação diferencial ordinária pode ser resolvida pela substituição de z = fe“, 


6.1.24 Usando a aritmética complexa disponível em FORTRAN, escreva um programa para calcular a 
exponencial complexa e? a partir de sua expansão de série (definição). Calcule e? para z = 
err/6 n = 0,1,2,...,12. Tabule o ângulo de fase (0 = n7/6), Rz, Sz, R(e7), S(e7), |e”| e 
a fase de e”. 
Valor de verificação. n=5,0=2,61799,R(z) = —0, 86602, 
Sz = 0, 50000, R(e7) = 0, 36913, S(e7) = 0, 20166, 
|e7| = 0, 42062, fase (e7) = 0,50000. 
6.1.25 Usando a aritmética complexa disponível em FORTRAN, calcule e tabule R(senh z), S(senh z), 
|senh z| e fase (senh z) para x = 0, 0(0, 1)1,0 e y = 0,0(0,1)1,0. 
Sugestão: Cuidado com a divisão por zero ao calcular um ângulo como um arco tangente. 
Valor de verificação. z = 0,2 + 0, 1i, R(senh z) = 0, 20033, 
S(senh z) = 0, 10184, |senh z| = 0, 22473, 
fase(senh z) = 0.47030. 
6.1.26 Repita o Exercício 6.1.25 para cosh z. 


6.2 Condições de Cauchy-Riemann 


Agora que já estabelecemos funções complexas de uma variável complexa, passamos a diferenciá-las. A derivada 
de f(z), tal como a de uma função real, é definida por 


am LCD a HO AO 
im = lim = 
320 z+ôz-z ôz=0 ôz dz 


F, (6.14) 


contanto que o limite seja independente da aproximação particular ao ponto z. Para variáveis reais, exigimos 
que o limite do lado direito (x — xo, por cima) e o limite do lado esquerdo (x — xo, por baixo) sejam iguais 
para que a derivada df (x) /da exista em z = zo. Agora, sendo z (ou zo) algum ponto em um plano, nosso requisito 
de que o limite seja independente da direção de aproximação é muito restritivo. 

Considere incrementos ôx e dy das variáveis x e y, respectivamente. Então, 


dz = ôx + ify. (6.15) 
Além disso, 

ôf = ĝu ido, (6.16) 
de modo que 

Òf _ ðu+iðv 

ôz r+ iðy SER 
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Vamos considerar o limite indicado pela Equação (6.14) por duas aproximações diferentes, como mostra a 
Figura 6.4. Primeiro, com ôy = 0, deixamos que dx — 0. A Equação (6.14) resulta em 


. ôf cute TOME OU ðu ðv 
am z jm (5 +2) “Oz Eear (619) 


Figura 6.4: Aproximações alternativas a 29. 


admitindo-se que as derivadas parciais existam. Para uma segunda aproximação, estabelecemos dx = 0 e então 


deixamos dy — 0. Isso leva a 
dao ôf du du) „ðu v 
ma z jim ( Sy T z) = “By j dy. (6.12) 


Como precisamos ter uma derivada df /dz, as Equações (6.18) e (6.19) devem ser idênticas. Igualando as partes 
reais às partes reais e as partes imaginárias às partes imaginárias (como componentes de vetores), obtemos 


= = . (6.20) 


Essas são as famosas condições de Cauchy-Riemann. Foram descobertas por Cauchy e usadas extensivamente 
por Riemann em sua teoria de funções analíticas. Essas condições de Cauchy-Riemann são necessárias para a 
existência de uma derivada de f(z); isto é, se df /dz existe, as condições de Cauchy-Riemann devem valer. 

Ao contrário, se as condições de Cauchy-Riemann forem satisfeitas e as derivadas parciais de u(x, y) e v(x, y) 
forem contínuas, a derivada df /dz existe. Isso pode ser mostrado escrevendo-se 


du ðv Odu ðv 
ja E + e)s de (5 E i öy. (621) 


A justificativa para essa expressão depende da continuidade das derivadas parciais de u e v. Dividindo por dz, 
temos 
ôf _ (du/dx + i(dv/dx))dx + (du/dy + i(dv/0y))dy 
ôz ôx + iðy 
(Ou/dx + i(Ov/0x)) + (3u/ðy + i(Ov/Oy))dy/dx 
1 +i(dy/dx) 


(6.22) 


Como df/ôz precisa ter um valor único, a dependência de dy, dx deve ser eliminada. Aplicando as condições 
de Cauchy-Riemann às derivadas em y, obtemos 


+il = ad (6.23) 


Substituindo a Equação (6.23) na Equação (6.22), podemos cancelar a dependência ĝy/ðx e 
df ðu ðv 
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o que mostra que lim ôf/ðz é independente da direção de aproximação no plano complexo, contanto que as 
derivadas parciais sejam contínuas. Assim, E existe e f é analítica em z. 

Vale a pena notar que as condições de Cauchy-Riemann garantem que as curvas u = cı serão ortogonais 
às curvas v = C2 (compare com a Seção 2.1). Isso é fundamental na aplicação a problemas de potencial em 
uma variedade de áreas da física. Se u = cı é uma linha de energia elétrica, v = c2 é uma linha (superfície) 
egiipotencial e vice-versa, Para ver isso, vamos escrever as condições de Cauchy-Riemann como um produto de 


razões de derivadas parciais, 


E e (6.25) 
Ug Uy 
com as abreviações 
ðu ðu ðv ðv 
Ər o dy e dom dy! 


Agora, lembre-se de que o significado geométrico de —u, /u, é a inclinação da tangente de cada curva u(x, y) = 
constante, e a mesma coisa para v(x, y) = constante. Isso significa que as curvas u = constante e v = constante 
são mutuamente ortogonais em cada interseção. Alternativamente, 


us de + uy dy = 0 = vy dz — vz dy 


nos diz que, se (dx, dy) é tangente à curva u, então a ortogonal (—dy, dx) é tangente à curva v no ponto de 
interseção, z = (x,y). Ou, o que é equivalente, uzvz + uyvy = O implica que os vetores gradientes (uz, uy) e€ 
(vz, Vy) são perpendiculares. Uma outra implicação para a teoria do potencial é desenvolvida no Exercício 6.2.1. 


Funções Analíticas 

Por fim, se f(z) é diferenciável em z = zo e em alguma pequena região em torno de 29, dizemos que f(z) é 
analítica” em z = zo. Se f(z) é analítica em todo o plano complexo (finito), nós a denominamos função inteira. 
Aqui, nossa teoria de variáveis complexas é uma teoria de funções analíticas de uma variável complexa, o que 
destaca a importância crucial das condições de Cauchy-Riemann. O conceito de analiticidade adotado em teorias 
avançadas da física moderna desempenha um papel crucial na teoria da dispersão (de partículas elementares). Se 
f'(z) não existir em z = zo, então zo é denominado ponto singular e adiamos seu estudo até a Seção 6.6. 

Para ilustrar as condições de Cauchy-Riemann, considere dois exemplos muito simples. 


Exemplo 6.2.1 22 É Anarírica 
Seja f(z) = 22, Então a parte real u(x, y) = «2 —y? e a parte imaginária v(x, y) = 2xy. Segundo a Equação (6.20), 


Ou ðv ðu ðv 

dx dy Oy dz 
Vemos que f(z) = 2? satisfaz as condições de Cauchy-Riemann em todo o plano complexo. Visto que as derivadas 
parciais são claramente contínuas, concluímos que f(z) = 22 é analítica. E 


Exemplo 6.2.2  2* Não é Analítica 


Seja f(z) = 2*. Agora u = x e v = —y. Aplicando as condições de Cauchy-Riemann, obtemos 
du ðv 
— =1# — =-1. 
dx 7 Oy 


As condições de Cauchy-Riemann não são satisfeitas e f(z) = z* não é uma função analítica de z. É interessante 
notar que f(z) = z* é contínua e, portanto, é um exemplo de uma função que é contínua em todo lugar mas não 
diferenciável em nenhum lugar no plano complexo. 

A derivada de uma função real de uma variável real é, em essência, uma característica local, no sentido de 
que ela fornece informação sobre a função somente em uma vizinhança local - por exemplo, como uma expansão 
de Taylor truncada. A existência de uma derivada de uma função de uma variável complexa tem implicações 
de alcance muito maior. As partes real e imaginária de nossa função analítica devem satisfazer separadamente a 
equação de Laplace. Esse assunto do Exercício 6.2.1. Além disso, nossa função analítica tem, garantidas, derivadas 
de todas as ordens, Seção 6.4. Nesse sentido, a derivada não somente comanda o comportamento local da função 
complexa, mas também controla o comportamento distante. E 


é Alguns autores usam o termo holomórfica ou regular. 


ELSEVIER 
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Exercícios 


6.2.1 


6.2.10 


6.2.11 


As funções u(x,y) e v(x,y) são, respectivamente, as partes real e imaginária de uma função 
analítica w(z). 


(a) Admitindo que as derivadas requeridas existem, mostre que 
Vºu=Vv=0. 


Soluções da equação de Laplace, tais como u(x,y) e v(x,y), são denominadas funções 
harmônicas. 
(b) Mostre que 
dudu v ðv 
z taa =O, 
dx dy dx Oy 
e dê uma interpretação geométrica. 
Sugestão: A técnica da Seção 1.6 permite que você construa vetores normais às curvas u(x, y) = ci 
e v(x, y) = cj. 
Mostre se a função f(z) = R(z) = x é analítica ou não. 
Agora que já mostramos que a parte real u(x, y) e a parte imaginária v(x, y) de uma função analítica 
w(z) satisfazem, cada uma por si, a equação de Laplace, mostre que ambas, u(x, y) e v(x, y), não 
podem ter nem um máximo nem um mínimo no interior de qualquer região na qual w(z) é 
analítica. (Elas só podem ter pontos de sela.) 
Sejam 4 = 92w/012, B = 92w/dx0y,C = 02w/dy2. Pelo cálculo de funções de duas variáveis, 
w(x, y), temos um ponto de sela se 
B2- AC >0. 


Com f(z) = u(x,y) + iv(x,y), aplique as condições de Cauchy-Riemann e mostre que nem 
u(x, y) nem v(x,y) têm um máximo ou um mínimo em uma região finita do plano complexo. 
(Veja também a Seção 7.3.) 
Ache a função analítica 

w(z) = u(x, y) + iva, y) 
se (a) u(x, y) = 2º — 3xy2, (b) v(x, y) = e “sen x. 
Se há alguma região comum na qual wı = u(x, y) + iv(z, y) e w2 = wï = u(x,y) — iv(x,y) são 
ambas analíticas, prove que u(x, y) e v(x, y) são constantes. 
A função f(z) = u(x, y) + iv(x, y) é analítica. Mostre que f*(z*) também é analítica. 
Usando f (ret?) = R(r,0)e'?("º, na qual R(r, 0) e B(r, 0) são funções reais diferenciáveis de r e 
0, mostre que as condições de Cauchy-Riemann em coordenadas polares se tornam 
ðR Rob 19R oD 


as 7 00º (b)-— = -R—. 


ro or 

Sugestão: Estabeleça a derivada primeiro com dz e em seguida com dz tangencial. 

Como uma extensão do Exercício 6.2.8, mostre que O(r,0) satisfaz a equação de 
Laplace em coordenadas polares. A Equação (2.35) (sem o termo final e igualada a zero) é o 
laplaciano em coordenadas polares. 

O escoamento bidimensional de fluido irrotacional é convenientemente descrito por um potencial 
complexo f(z) = u(x,v) + iv(x, y). Denominamos a parte real, u(x, y), velocidade potencial, e a 
parte imaginária, v(x, y), função corrente. A velocidade do fluido V é dada por V = Vu. Se f(z) 
é analítica, 

(a) Mostre que df /dz = Vz — iVy; 

(b) Mostre que V - V = 0 (nenhuma fonte, nenhum mergulho); 

(c) Mostre que V x V = 0 (escoamento irrotacional, não-turbulento). 


Uma prova da desigualdade de Schwarz (Seção 10.4) envolve minimizar uma expressão, 
Í = Paa +A an + Abas + AN boy 2 0. 


Os 1) são integrais de produtos de funções; Yaa € Yap SãO reais, Yap é complexa e À é um parâmetro 
complexo. 
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(a) Diferencie a expressão precedente com relação a A“, tratando À como um parâmetro 
independente, independente de A*. Mostre que igualar a derivada 9 f/0A* a zero resulta em 
Va 
Yo 
(b) Mostre que 3f /3A = 0 leva ao mesmo resultado. 


(c) Sejam À = x + iy, A“ = x — iy. Iguale as derivadas de x e y a zero e mostre, mais uma vez, 
que 


à= 


Vab 
A=—&, 
Wob 


Essa independência de À e A“ aparece novamente na Seção 17.7. 


6.2.12 A função f(z) é analítica. Mostre que a derivada de f(z) em relação a z* não existe, a menos que 
f(z) seja uma constante. 
Sugestão: Use a regra da cadeia e tome x = (z + 2')/2,y = (z — 2*)/2i. 
Nota: Esse resultado enfatiza que nossa função analítica f(z) não é apenas uma função complexa 
de duas variáveis reais x e y. Ela é uma função da variável complexa x + iy. 


6.3 Teorema Integral de Cauchy 


Integrais de Contorno 
Agora que já temos a diferenciação sob controle, passamos para a integração. A integral de uma variável complexa 
sobre um contorno no plano complexo pode ser definida por uma analogia fiel à integral (de Riemann) de uma 
função real integrada ao longo do eixo real x. 

Dividimos o contorno de zo a z4 em n intervalos, escolhendo n — 1 pontos intermediários 21, 22,... sobre o 
contorno (Figura 6.5). Considere a soma 


(6.26) 
yA =a 
Figura 6.5: Caminho de integração. 
em que Ç; é um ponto sobre a curva entre zj e zj—1. Agora deixe que 
lz; = 2,1] > 0 
para todo j. Se o liMmn—oo Sn existe e é independente dos detalhes da escolha dos pontos z; e Çj, então 

n žo 
lim S Gz — z1) = / f(z) dz. (6.27) 

j=1 zo 


O lado direito da Equação (6.27) é denominado integral de contorno de f(z) (ao longo do contorno especificado 
C de z = z0 a z = 2%). 
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O desenvolvimento precedente da integral de contorno é estritamente análogo à integral de Riemann de uma 
função real de uma variável real. Como alternativa, a integral de contorno pode ser definida por 


m f(z)dz = a [u(zx, y) + iv(z, y)] [dx + idy] 


Y 
aA T2,Y2 
= / [u(x,y) de — v(x, y) dy] + E| [u(x y) de + u(x, y)dy] , 
£1,Yı T1,y1 


com a junção de caminho (x1, y1) e (£2, Y2) especificada. Isso reduz a integral complexa à soma complexa de 
integrais reais, o que guarda uma certa analogia com a substituição de uma integral vetorial pela soma vetorial 
de integrais escalares, Seção 1.10. 

Um exemplo importante é a integral de contorno f, c% dz, em que ČC é um círculo de raio r > 0 ao redor 


da origem z = 0 no sentido matemático positivo (anti-horário). Parametrizamos o círculo como z = ret? e 
dz = ire'? d0 em coordenadas polares da Equação (6.4c). Então, para n Æ —1, sendo n um inteiro, obtemos 
1 roti f?r 
— "ggs ) 1)0| do 
Sm do z” dz E Í exp[i(n + 1)0] 
= [2mi(n + 1)] ret [e+] T = 0 (6.27a) 
porque 27 é um período de e'("+1)º ao passo que, para n = —1 
1 fd IE c 
SR do =, (6.27b) 


ri Jo z 27 Jo 


mais uma vez independente de r. 
Alternativamente, podemos integrar ao redor de um retângulo com os vértices z1, Z2, 23, 24 para obter para 


n&-—l 
n+1 
fri 4 
n+1 


porque cada ponto de vértice aparece uma vez como um limite superior e uma vez como um limite inferior que se 
cancelam. Para n = —1, as partes reais correspondentes dos logaritmos se cancelam de maneira semelhante, mas 
suas partes imaginárias envolvem os argumentos crescentes dos pontos de z1 a z4 e, quando voltamos ao primeiro 
vértice 21, seu argumento aumentou de 27 devido à multivalidade do logaritmo, portanto, 27% é deixado de parte 
como o valor da integral. Assim, o valor da integral que envolve uma função de valor múltiplo deve ser o valor 
que é alcançado de um modo contínuo no caminho tomado. Essas integrais são exemplos do teorema integral 
de Cauchy, que consideramos na seção seguinte. 


a 
= 0, 


Z4 


Z Z 2. 
2 zn+1 3 qr 4 n+1 


zZ 


Taki 


EEE Caril. 


Z1 


Z2 


Prova do Teorema de Stokes 
O teorema integral de Cauchy é o primeiro de dois teoremas básicos da teoria do comportamento de funções 
de uma variável complexa. Em primeiro lugar, oferecemos uma prova sob condições relativamente restritivas — 
condições que são intoleráveis para o matemático que está desenvolvendo uma linda teoria abstrata, mas que em 
geral são satisfeitas em problemas físicos. 

Se uma função f(z) é analítica, isto é, se suas derivadas parciais são contínuas em toda alguma região 
simplesmente conectada R,” para todo caminho fechado C (Figura 6.6) em R, e se é de valor único (o que 
admitimos aqui por simplicidade), a integral de linha de f(z) ao redor de C é zero ou 


f f(z)dz = f, f(z)dz =0. (6.270) 


Lembre-se de que na Seção 1.13 essa função f(z), identificada como uma força, era denominada conservativa. O 
símbolo $ é usado para enfatizar que o caminho é fechado. Note que o interior da região simplesmente conectada 
limitada por um contorno é aquela região que se encontra à esquerda quando se percorre a direção indicada pelo 
contorno; como regra, uma região simplesmente conectada é limitada por uma única curva fechada. 


7Qualquer curva simples fechada (que não se intercepta a si mesma) dentro de uma região simplesmente conectada, ou domínio pode ser 
contraída até um único ponto que ainda pertence à região. Se uma região não é simplesmente conectada, ela é denominada multiplamente 
conectada. Como exemplo de região multiplamente conectada, considere o plano z com o interior do círculo unitário excluído. 
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y. 


p 
Ri 


Figura 6.6: Um contorno fechado C dentro de uma região R simplesmente conexa. 


X 


Nessa forma, o teorema integral de Cauchy pode ser provado por aplicação direta do teorema de Stokes (Seção 
1.12). Com f(z) = u(x, y) + iv(x, y) e dz = dz + idy, 


$ f(z) dz = f (u + iv)(da + idy) 
c c 
= f (ude - vdy) +i $ (vde + udo). (6.28) 
c 
Essas duas integrais de linha podem ser convertidas a integrais de superfície pelo teorema de Stokes, um 


procedimento que é justificado se as derivadas parciais forem contínuas dentro de C. Ao aplicar o teorema de 
Stokes, note que as duas integrais finais da Equação (6.28) são reais. Usando 


o teorema de Stokes diz que 
oV) Vz 
f (Vz da + Vy dy) = / (So = ) dz dy. (6.29) 
c ox Oy 
Seja u = Vz e v = —V,, para a primeira integral na última parte da Equação (6.28).º Então, 


f (ude = vdu) = $ (Va de + Vydo) 


oVy Vz ðv ðu 
= = — da dy = — — + — | de dy. 6.30 
E- F)ea-- (Eta) ui 
Seja u = Vy e v = V, para a segunda integral no lado direito da Equação (6.28). Usando o teorema de Stokes mais 
uma vez, obtemos 
foa+ua= (2-2) dz dy. (6.31) 


Aplicando as condições de Cauchy-Riemann, que devem valer, uma vez que, por suposição, f(z) é analítica, cada 
integrando desaparece e 


froa=-f (2+3) awati f (2-2) dz dy = 0. (6.32) 


Prova de Cauchy-Goursat 

Isso conclui a prova do teorema integral de Cauchy. Contudo, de um ponto de vista teórico, ela é prejudicada 
pela necessidade de continuidade das primeiras derivadas parciais. Na verdade, como demonstrado por Goursat, 
essa condição não é necessária. Damos a seguir um esboço da prova de Goursat. Subdividimos a região dentro do 
contorno €' em uma rede de pequenos quadrados, como indicado na Figura 6.7. Então, 


Na prova do teorema de Stokes, Seção 1.12, Vz e Vy são duas funções quaisquer (com derivadas parciais contínuas). 
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Figura 6.7: Contornos de Cauchy-Goursat. 


EG dz = Df f(z) dz, (6.33) 


e todas as integrais ao longo das linhas internas são canceladas. Para estimar a fo. f(z) dz, construímos a função 
I 


F — F) df) 


A dz 


ôj(z, zj) = 


, (6.34) 


Z=Zj 
sendo z; um ponto interior da j-ésima sub-região. Note que [f(2) — f(z;)]/(2— z;) é uma aproximação da derivada 
em z = zj. De modo equivalente, podemos notar que, se f(z) tivesse uma expansão de Taylor (o que ainda não 


provamos), então d;(z, zj) seria de ordem z — z;, aproximando-se de zero à medida que a rede ficasse cada vez 
mais delgada. Mas, uma vez que f'(z;) existe, isto é, é finita, podemos fazer 


[0;(2,25)| < e, (6.35) 


em que £ é uma quantidade positiva pequena escolhida arbitrariamente. Resolvendo a Equação (6.34) para f(z) e 
integrando ao redor de C}, obtemos 


f f(z)dz = f (z — z;)ô;(z, 25) dz, (6.36) 
Cj Cj 
sendo que as integrais dos outros termos desaparecem.? Quando as Equações (6.35) e (6.36) são combinadas, 


podemos mostrar que 
) $ f(z)dz 
A 


em que A é um termo da ordem da área da região envolvida. Visto que € é arbitrário, deixamos que £ — 0 e 
concluímos que, se uma função f(z) é analítica sobre e dentro de um caminho fechado C, 


< Ae, (6.37) 


f f(z)dz = 0. (6.38) 
C 


Detalhes da prova dessa forma significativamente mais geral e mais poderosa podem ser encontrados em Churchill 
nas Leituras Adicionais. Na verdade, ainda podemos provar o teorema para f(z) analítica dentro do interior de C' 
e somente contínua sobre C'. 

A conseqüência do teorema integral de Cauchy é que, para funções analíticas, a integral de linha é uma função 
apenas de suas extremidades, independente do caminho de integração, 


IN f(z) dz = F(z2)— F(z1) = -[ F(z) dz, (6.39) 


mais uma vez exatamente como no caso de uma força conservativa, Seção 1.13. 


º$ dze $ zdz = 0 e pela Equação (6.273). 
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SM 


C 
A EE, 


Figura 6.8: Um contorno fechado C em uma região multiplamente conexa. 


Figura 6.9: Conversão de uma região multiplamente conexa em uma região simplesmente conexa. 


Regiões Multiplamente Conexas 

O enunciado original do teorema integral de Cauchy exigia uma região simplesmente conexa. Essa restrição pode 
ser amenizada pela criação de uma barreira, uma linha de contorno. A finalidade da construção da linha de contorno 
que apresentamos a seguir é permitir, dentro de uma região multiplamente conexa, a identificação de curvas que 
podem ser reduzidas a um ponto dentro da região, isto é, a construção de uma sub-região que é simplesmente 
conexa. 

Considere a região multiplamente conexa da Figura 6.8, na qual f(z) não é definida para o interior, R’. O 
teorema integral de Cauchy não é válido para o contorno C, como já demonstrado, mas podemos construir um 
contorno C” para o qual o teorema vale. Desenhamos uma linha desde a região proibida interior, R’, até a região 
proibida exterior a R, e então construímos um novo contorno, C”, como mostra a Figura 6.9. 

O novo contorno, C”, por meio de ABDEFGA, nunca cruza a linha de contorno que literalmente converte R em 
uma região simplesmente conexa. Uma técnica tridimensional análoga a essa foi usada na Seção 1.14 para provar 
a lei de Gauss. Pela Equação (6.39), 


L f(z)dz = — A f(z) dz, (6.40) 


sendo que f(z) se mantém contínua por toda a linha de contorno e segmentos de linhas DE e GA arbitrariamente 
próximos um do outro. Então, 


z) dz = z) dz z) dz = : 
sad f tode f  fe)de=0 (641) 


pelo teorema integral de Cauchy, com a região R agora simplesmente conexa. Aplicando a Equação (6.39) mais 
uma vez com ABD > C} e EFG — —C;}, obtemos 


f(z)dz = f(z) dz, (6.42) 
Ci C3 
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na qual Cj e C$ são ambas atravessadas na mesma direção (sentido anti-horário, isto é, positivo). 

É preciso enfatizar que, aqui, a linha de contorno é uma questão de conveniência matemática, para permitir a 
aplicação do teorema integral de Cauchy. Uma vez que f(z) é analítica na região anular, ela é necessariamente de 
valor único e contínua por toda qualquer linha de contorno como essa. 


Exercícios 
6.3.1 Mostre que [2 f(z) dz = — [5 f(2) dz. 


6.3.2 Prove que 
|f faz 
c 


em que |f|máx é O valor máximo de |f(z)| ao longo do contorno C e L é o comprimento do 


contorno. 
ai 
/ z“ dz 
0,0 


depende do caminho avaliando a integral para os dois caminhos mostrados na Figura 6.10. Lembre- 
se de que f(z) = z* não é uma função analítica de z e que, portanto, o teorema integral de Cauchy 


não se aplica. 
d 
f 52,50, 
cr +z 


6.3.4 Mostre que 
na qual o contorno C é um círculo definido por |z| = R > 1. 
Sugestão: A utilização direta do teorema integral de Cauchy não é válida. Por quê? A integral pode 
ser avaliada transformando-se para coordenadas polares e usando-se tabelas. Isso resulta em 0 para 
R>le?2riparaR<I. 


< [max º L, 


6.3.3 Verifique que 


y 


a, 1) 


Figura 6.10: Contorno. 


6.4 Fórmula Integral de Cauchy 


Assim como na seção precedente, consideramos uma função f(z) que é analítica sobre um contorno fechado C e 
dentro da região interior limitada por C. Procuramos provar que 


1 (2) 


2mi Jo 2— zo 


dz = f(zo), (6.43) 
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na qual zo é qualquer ponto na região interior limitada por C. Esse é o segundo dos dois teoremas básicos 
mencionados na Seção 6.3. Note que, uma vez que z está sobre o contorno C, enquanto zo está no interior, 
z — žo Æ 0, e a equação integral, Equação (6.43), é bem definida. Embora, por suposição, f(z) seja analítica, o 
integrando é f(z)/(z — zo) e não é analítico, em z = zo, a menos que f(z9) = 0. Se o contorno é deformado como 
mostrado na Figura 6.11 (ou Figura 6.9, Seção 6.3), o teorema integral de Cauchy se aplica. Pela Equação (6.42), 


y 


4 


/ 


4! 
C j! Linha de contorno 


Figura 6.11: Exclusão de um ponto singular. 


KD iy Vos 0, (6.44) 


CZT 20 C Z T Z0 


em que C é o contorno externo original e C2 é o círculo que envolve o ponto zo percorrido em direção anti- 
horária. Seja z = zo + re'”, usando a representação polar por causa da forma circular do caminho ao redor de 20. 
Aqui r é pequeno e eventualmente terá de se aproximar de zero. Temos (com dz = iret”? dO pela Equação (6.27a)) 


io 
f(z) dz= F(zo a ) ieit do. 
Cc, 2— 20 C2 re’ 
Tomando o limite, à medida que r — 0, obtemos 
PO poi fds 
dz = if (zo) do = 2mif(zo), (6.45) 
Cs Z— zo C2 


uma vez que f(z) é analítica e, portanto, contínua em z = 29. Isso prova a fórmula integral de Cauchy. 

Eis aqui um resultado notável. O valor de uma função analítica f(z) é dado em um ponto interior z = 20, 
uma vez que os valores sobre a fronteira de C' sejam especificados. Isso é rigorosamente análogo a uma forma 
bidimensional da lei de Gauss (Seção 1.14) na qual a grandeza da carga de uma linha interior seria dada em termos 
da integral de superfície cilíndrica do campo elétrico E. 

Outra analogia é a determinação de uma função em um espaço real por uma integral da função e a 
correspondente função de Green (e suas derivadas) sobre a superfície limitada. A teoria da difração de Kirchhoff é 
um exemplo disso. 

Até aqui sempre ressaltamos que zo é um ponto interior. O que acontece se 29 for exterior a C? Nesse caso, o 
integrando inteiro é analítico sobre e dentro de C. O teorema integral de Cauchy, Seção 6.3, se aplica e a integral 


se anula. Temos 
1 f f(z)dz i f(zo), zo interior 


2mi Jo z — zo 0, Zo exterior. 


Derivadas 
A fórmula integral de Cauchy pode ser usada para obter uma expressão para a derivada de f(z). Pela 


Equação (6.43), com f(z) analítica, 
f(zo + 920) — f (zo) 1 ($ F dz f dz); 


zo 2riðzo zZ — žo — 620 Z — 20 
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Então, por definição de derivada (Equação (6.14)), 


52020 2riðzo z — zo — ôzo)(z — zo) 


eo 
= di dz. (6.46) 


2mi z — 20)? 


Esse resultado poderia ter sido obtido por diferenciação da Equação (6.43) sob o sinal de integral em relação a 29. 
Essa abordagem formal é válida, mas a justificativa para ela está contida na análise precedente. 

Essa técnica para construir derivadas pode ser repetida. Escrevemos f'(zo + zo) e f'(z9), usando a 
Equação (6.46). Subtraindo e dividindo por 20, e finalmente tomando o limite, à medida que zo — 0, temos 


Oa) mf 


Note que f? (zo) é independente da direção de 529, como deve ser. Continuando, obtemos!º 


f(x) = TF die. (6.47) 


2mi z — zo)” tt? 


isto é, o requisito de que f(z) seja analítica garante não somente uma derivada de primeira ordem, mas também 
derivadas de todas as ordens! As derivadas de f(z) são automaticamente analíticas. Note que essa afirmação 
admite a versão de Goursat do teorema integral de Cauchy. É também por isso que a contribuição de Goursat é tão 
significativa no desenvolvimento de variáveis complexas. 


Teorema de Morera 


Uma aplicação adicional da fórmula integral de Cauchy é na prova do teorema de Morera, que é o inverso do 
teorema integral de Cauchy. O teorema afirma o seguinte: 

Se uma função f(z) é contínua em uma região simplesmente conexa R e 

$o f(2) dz = 0 para todo contorno fechado C dentro de R, então f(z) é analítica em toda R. 


Vamos integrar f(z) de 2; a z2. Visto que toda integral de caminho fechado de f(z) se anula, a integral é 
independente de caminho e depende somente de suas extremidades. Rotulamos o resultado da integração F(z), 
com 


F(z2) — F(x) = [ Í f(z) dz. (6.48) 
Como identidade, 
rs Fis “2 tr(o) — Fz) dt 
F( EA 1) E E Ja dO 1)] (6.49) 


usando t como uma outra variável complexa. Agora consideramos o limite à medida que z2 — 21: 


im SVO Mande a eso 


Z221 24 


já que f(t) é contínua.!! Portanto, 


Z2 21 24 


E Fase tia) (6.51) 


pela definição de derivada (Equação (6.14)). Já provamos que F'(z) em z = z; existe e é igual a f(21). Uma vez 
que z1é qualquer ponto em R, vemos que F(z) é analítica. Então, pela fórmula integral de Cauchy (compare com 
a Equação (6.47)), F'(z) = f(z) também é analítica, provando o teorema de Morera. 


10Essa expressão é o ponto de partida para definir derivadas de ordem fracionária. Veja A. Erdelyi (Ed.), Tables of Integral Transforms, vol. 
2. Nova York: McGraw-Hill (1954). Para aplicações recentes à análise matemática, veja T. J. Osler, An integral analogue of Taylor’s series and 
its use in computing Fourier transforms. Math. Comput. 26: 449 (1972), e referências nele encontradas. 

11 Aqui citamos o teorema do valor médio do cálculo. 
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Aproveitando mais uma vez nossa analogia eletrostática, poderíamos usar f(z) para representar o campo 
eletrostático E. Se a carga líquida dentro de toda região fechada em R é zero (lei de Gauss), a densidade de 
carga é zero em todo lugar em R. Alternativamente, em termos da análise da Seção 1.13, f(z) representa uma 
força conservativa (pela definição de conservativa) e então constatamos que é sempre possível expressá-la como a 
derivada de uma função potencial F(z). 

Uma importante aplicação da fórmula integral de Cauchy é a desigualdade de Cauchy, que apresentamos a 
seguir. Se f(z) = J` anz” é analítica e limitada, |f(z)| < M sobre um círculo de raio r em torno da origem, 
então 

lan|r” < M (desigualdade de Cauchy) (6.52) 


dá limites superiores para os coeficientes de sua expansão de Taylor. Para provar a Equação (6.52), vamos definir 
M(r) = máxļ|zj=r|f(z)| e usar a fórmula integral de Cauchy para an: 


{ C a <mo a 


pe gzn+1 = 9mypr+l . 


1 
lan] = 5— 


27 


Uma conseqiiência imediata da desigualdade (6.52) é o teorema de Liouville: se f(z) é analítica e ligada em todo 
o plano complexo, ela é uma constante. De fato, se |f(2)| < M para todo z, então a desigualdade de Cauchy (6.52) 
resulta em |an| < Mr” — 0, à medida que r — oo para n > 0. Daí, f(z) = ao. 

Ao contrário, o mais insignificante desvio de uma função analítica em relação a um valor constante implica que 
deve haver no mínimo uma singularidade em algum lugar no plano complexo infinito. Então, à parte as funções 
constantes triviais, singularidades são coisas da vida, e devemos aprender a viver com elas. Mas faremos mais 
do que isso. Em seguida, expandiremos uma função em uma série de Laurent em uma singularidade e usaremos 
singularidades para desenvolver o poderoso e útil cálculo de resíduos no Capítulo 7. 

Uma famosa aplicação do teorema de Liouville resulta no teorema fundamental da álgebra (devido a C. F. 
Gauss), que diz que qualquer polinômio P(z) = ij ayz” com n > O e an Æ O tem n raízes. Para provar 
isso, suponha que P(z) não tem nenhum zero. Então 1/P(z) é analítica e ligada, à medida que |z| — oo. Por 
conseguinte, P(z) é uma constante pelo teorema de Liouville, como queríamos demonstrar. Assim, P(z) tem no 
mínimo uma raiz zo e podemos dividí-lo por (z — zo). Então repetimos o processo para o polinômio resultante de 
grau n — 1. Isso leva à conclusão de que P(z) tem exatamente n raízes. 


Exercícios 
6.4.1 Mostre que 


ni) 2m% n=-1, 
f e-a) de= 0. is 


em que o contorno € circunda o ponto z = zo em um sentido positivo (anti-horário). O expoente 
n é um inteiro. Veja também a Equação (6.27a). O cálculo de resíduos, Capítulo 7, é baseado nesse 
resultado. 


6.4.2 Mostre que 
1 


— A m e n inteiros 
27% 


(com o contorno circundando a origem uma vez, em sentido anti-horário) é uma representação do 
Ômn- 

6.4.3 Resolva o Exercício 6.3.4 separando o integrando em frações parciais e então aplicando o teorema 
integral de Cauchy para regiões multiplamente conectadas. 
Nota: Frações parciais são explicadas na Seção 15.8 em conexão com as transformadas de Laplace. 


6.4.4 Avalie 
f dz 
C 22 = 1 i 


em que C é o círculo |z| = 2. 


6.4.5 Admitindo que f(z) é analítica sobre e dentro de um contorno fechado C e que o ponto zo está 
dentro de €, mostre que 
£ 
A E E 
Cama c (2 — 20) 
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6.4.6 Você sabe que f(z) é analítica sobre e dentro de um contorno fechado C e suspeita que a derivada 
de enésima ordem f(") (zo) é dada por 


fo) = TE f(z) 


2mi z= zo) nti 


Usando indução matemática, prove que essa expressão é correta. 


6.4.7 (a) Uma função f(z) é analítica dentro de um contorno fechado C (e contínua em C). Se f(z) # 0 
dentro de C e | f(z)| < M sobre C, mostre que 


F| <M 


para todos os pontos dentro de C. 
Sugestão: Considere w(z) = 1/ f(z). 

(b) Se f(z) = 0 dentro do contorno C, mostre que o resultado anterior não é válido e que é 
possível ter |f(z)| = O em um ou mais pontos no interior com |f (z)| > 0 sobre todo o contorno 
limitador. Cite um exemplo específico de uma função analítica que se comporta desse modo. 

6.4.8 Usando a fórmula integral de Cauchy para a derivada de enésima ordem, converta as seguintes 
fórmulas de Rodrigues nas integrais correspondentes ditas de Schlaefli. 


(a) Legendre: 
1. dê) os n 
Palo) = sum ga (8 — D- 


-19" 1 1— 22)" 
Rësposia: £ ) . + ( 3 dz 


(b) Hermite: 


2 d” 2 
H, — —1 Na 2 = e 
(1) = (ee 
(c) Laguerre: 
e” d” n p — r 
Lala) = ga E e=]; 


Nota: Pelas representações da integral de Schlaefli podemos desenvolver funções geradoras para 
essas funções especiais. Compare com as Seções 12.4, 13.1 e 13.2. 


6.5 Expansão de Laurent 


Expansão de Taylor 
A fórmula integral de Cauchy da seção anterior abre o caminho para outra derivação da série de Taylor (Seção 5.6), 
mas, desta vez, para funções de uma variável complexa. Suponha que estamos tentando expandir f(z) em torno 
de z = zo e temos z = zı como o ponto mais próximo no diagrama de Argand para o qual f(z) não é analítica. 
Construímos um círculo C com centro em z = zo e raio menor do que |z1 — zo| (Figura 6.12). Uma vez que 
admitimos que 24 é o ponto mais próximo no qual f(z) não era analítica, f(z) é necessariamente analítica sobre e 
dentro de C. 
Pela Equação (6.43), a fórmula integral de Cauchy, 
f , 
e E Aa a 


2ni Jo 2 -z 


A f(z) dz 

— 2i f, (z! — z0) — (z — zo) 

A fz) dz 

— 2i f, (z! — zo) — (z — zo) /(z! — 20)] (6.53) 


Aqui, z’ é um ponto sobre o contorno C e z é qualquer ponto interior a C. Ainda não é válido expandir o 
denominador do integrando na Equação (6.53) pelo teorema binomial porque não provamos o teorema binomial 
para variáveis complexas. Em vez disso, notamos a identidade 


1 D0 
—D=istré2rtro=) 4 .54 
TE +t+ + t+ > ; (6.54) 
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Figura 6.12: Domínio circular para a expansão de Taylor. 


que pode ser verificada com facilidade multiplicando ambos os lados por 1—t. A série infinita, seguindo os métodos 
da Seção 5.2, é convergente para |t| < 1. 
Agora, para um ponto z interior C, |z — zo| < |z" — zo|, e, usando a Equação (6.54), a Equação (6.53) se torna 


E (2) dz 
HO) =$, 2 EE a (6.55) 


Trocando a ordem de integração e o somatório (válido porque a Equação (6.54) é uniformemente convergente para 
|t| < 1, obtemos 


RES n f(z’) dz 
f(z) = DR Ale — 20) f, (2 o) tT (6.56) 
Referindo-nos à Equação (6.47), obtemos 
2 (n) 
f(z) = Az — ori e (6.57) 


que é nossa desejada expansão de Taylor. Note que ela é baseada somente na suposição de que f(z) é analítica 
para |z — 20] < |21 — zo|. Exatamente como para séries de potências de variável real (Seção 5.7), essa expansão é 
única para um dado 20. 

Pela expansão de Taylor para f(z), um teorema binomial pode ser derivado (Exercício 6.5.2). 


Princípio de Reflexão de Schwarz 
Pela expansão binomial de g(z) = (z — xo)” para n inteiro, é fácil ver que o conjugado complexo da função g é a 
função do conjugado complexo para xo real: 


g'(2) = [(z == zo)" =(2*— xo)” = g(2). (6.58) 


Isso nos leva ao princípio de reflexão de Schwarz: 
Se uma função f(z) é (1) analítica sobre alguma região incluindo o eixo real e (2) real quando z i é real, então 


F (2) = f(2*). (6.59) 
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f) = ulx, y) + iv(x, y) 
= f*(z*) = u(x, —y) — iv(x, —y) 


> 
u 


f5) = ulx, —y) + iv(x, —) 
=f*(2) = u(x, y)— iv(x, y) 


Figura 6.13: Reflexão de Schwarz. 


(Veja a Figura 6.13.) 
Expandindo f(z) em torno de algum ponto xo (não-singular) sobre o eixo real, 


Es (g 
a=% e- y (eo) ; (6.60) 


S n! 
pela Equação (6.56). Uma vez que f(z) é analítica em z = zo, essa expansão de Taylor existe. Visto que f(z) é real 
quando z é real, f(") (xo) deve ser real para todo n. Então, quando usamos a Equação (6.58), resulta imediatamente 
o princípio da reflexão de Schwarz, Equação (6.59). O Exercício 6.5.6 é outra forma desse princípio. Isso conclui 
a prova dentro de um círculo de convergência. Então, a continuação analítica permite estender esse resultado para 
toda a região de analiticidade. 


Continuação Analítica 

É natural pensar nos valores f (z) de uma função analítica f como uma entidade única, que é usualmente definida 
em alguma região restrita de Sı do plano complexo, por exemplo, por uma série de Taylor (veja a Figura 6.14). 
Então, f é analítica dentro do círculo de convergência C4, cujo raio é dado pela distância rı do centro de C4 até 
a singularidade mais próxima de f em 24 (na Figura 6.14). Uma singularidade é qualquer ponto onde f não é 
analítica. Se escolhermos um ponto dentro de C4 que está mais distante da singularidade zı do que rı e fizermos 
uma expansão de Taylor de f em torno dele (z2 na Figura 6.14), então o círculo de convergência, C2, usualmente 
se estenderá para além do primeiro círculo, C1. Na região de sobreposição de ambos os círculos, C1, C2, a função 
f é unicamente definida. Na região do círculo C2 que se estende para além de C4, f(z) é unicamente definida pela 
série de Taylor em torno do centro de Cù e é analítica ali, embora nesse mesmo lugar a série de Taylor em torno 
do centro de C4 já não seja mais convergente. Segundo Weierstrass, esse processo é denominado continuação 
analítica. Ele define as funções analíticas em termos de sua definição original (em C4, digamos) e todas as suas 
continuações. 

Um exemplo específico é a função 


1 
E 6.61 
=> (6.61) 
que tem um pólo (simples) em z = —1 e é analítica em outros lugares. A expansão de série geométrica 
1 S a (6.62) 
l1+z i 


n=0 
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Figura 6.14: Continuação analítica. 


converge para |z| < 1, isto é, dentro do círculo C4 na Figura 6.14. 
Suponha que expandimos f(z) em torno de z = i, portanto, 


Eos 1 o 1 
l+z 1+i+(z-i) A+d)A+r(z-)/(1+%)) 
z—i (z-i)? 1 


O EA 


f) = 


= 1 


(6.63) 


converge para |z — il < |1 +iļ = v2. Nosso círculo de convergência é Co na Figura 6.14. Agora, f(z) é 
definida pela expansão (6.63) em S2, que se sobrepõe a Sı e se estende ainda mais longe no plano complexo. !? 
Essa extensão é uma continuação analítica e, quando estivermos lidando apenas com pontos singulares isolados, a 
função poderá ser estendida indefinidamente. As Equações (6.61), (6.62) e (6.63) são três representações diferentes 
da mesma função. Cada representação tem seu próprio domínio de convergência. A Equação (6.62) é uma série de 
Maclaurin. A Equação (6.63) é uma expansão de Taylor em torno de z = i, e, pelos próximos parágrafos, vemos 
que a Equação (6.61) é uma série de Laurent de apenas um termo. 

A continuação analítica pode tomar várias formas, e a expansão de série que acabamos de considerar não 
é necessariamente a técnica mais conveniente. Como técnica alternativa, usaremos uma relação funcional na 
Seção 8.1 para estender a função fatorial ao redor dos pontos singulares isolados z = —n, n = 1,2,3,... 
Como outro exemplo, a equação hipergeométrica é satisfeita pela função hipergeométrica definida pelas séries, 
Equação (13.115), para |z| < 1. A representação integral dada no Exercício 13.4.7 permite uma continuação para 
dentro do plano complexo. 


Série de Laurent 
Encontramos freqüentemente funções que são analíticas e de valor único em uma região anular, digamos, de 
raio interno r e raio externo R, como mostra a Figura 6.15. Desenhando uma linha de contorno imaginária para 


12Um dos resultados mais poderosos e belos da teoria mais abstrata de funções de uma variável complexa é que, se duas função analíticas 
coincidem em qualquer região, tal como a sobreposição de S1 e S2, ou coincidem sobre qualquer segmento de linha, elas são a mesma função no 
sentido de que coincidirão em todo lugar, contanto que sejam ambas bem definidas. Nesse caso, a concordância das expansões (Equações (6.62) 
e (6.63)) sobre a região comum a S1 e S2 estabeleceria a identidade das funções que essas expansões representam. Então a Equação (6.63) 
representaria uma continuação analítica ou extensão de f(z) para regiões não cobertas pela Equação (6.62). Poderíamos também dizer, com a 
mesma propriedade, que f(z) = 1/(1 + z) é, por si, uma continuação analítica de qualquer das séries dadas pelas Equações (6.62) e (6.63). 
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converter nossa região em uma região simplesmente conexa, aplicamos a fórmula integral de Cauchy e, para dois 
círculos C2 e C1 com centro em z = 29 e raios r2 e r1, respectivamente, em quer < r2 < rı < R, temos! 


o 1 f(z) dz 1 f(z) dz 
Ha = 271 A 271 A é (6.6) 


z — x 


z — É 


Linha de 
contorno 


Figura 6.15: |z" — zolc, > |z — zol; |z" — zolo, < |z — zol. 


Note que na Equação (6.64) foi introduzido um sinal de menos explícito, de modo que o contorno Cs (assim 
como C4) deve ser percorrido no sentido positivo (anti-horário). Agora o tratamento da Equação (6.64) prossegue 
exatamente como o da Equação (6.53) no desenvolvimento da série de Taylor. Cada denominador é escrito como 
(2 — zo) — (z — zo) e expandido pelo teorema binomial, que agora resulta da série de Taylor (Equação (6.57). 

Notando que, para C1, |z" — zo| > |z — zo|, enquanto para C3, |z" — zo| < |z — zol, encontramos 


1 2) dy 
10) = ami 268 = 20) A ça 
1 < —n 1 n— 1 1 
+ om Ade — 20) A (2 — zo) Tt f(z) dz. (6.65) 


O sinal de menos da Equação (6.64) foi absorvido pela expansão binomial. Denominando a primeira série S4 e a 


segunda S2, temos 
OO 


1 2) dz 
s=) e- a)” $ Eia (6.66) 
ma des c (2 — zo) 
que é a expansão de Taylor regular, convergente para |z — zo| < |z" — zo] = rı, isto é, para todo z interior ao 


círculo maior, C4. Para a segunda série na Equação (6.65), temos 


oO 


S2 = — (z— o" é (2 — zo) "Tt f(z") dz’, (6.67) 
C2 


13Podemos tomar r2 arbitrariamente próximo a r, e rı arbitrariamente próximo a R, maximizando a área contida entre C1 e C2. 
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convergente para |z — zo| > |z" — zo| = r2, isto é, para todo z exterior ao círculo menor, C2. Lembre-se de que 
Cs agora corre em sentido anti-horário. 
Essas duas séries são combinadas em uma só!4 (uma série de Laurent) por 


F= >, anlz— 20)", (6.68) 
em que 
o 1l f(z) dz 
ic 2mi f, (z! — zo)” tt (6.69) 


Uma vez que na Equação (6.69) a convergência de uma expansão binomial já não é mais um problema, C pode 
ser qualquer contorno dentro da região anular r < |z — zo| < R que circunda zọ uma vez em sentido anti-horário. 
Se admitirmos que tal região anular de convergência de fato existe, então a Equação (6.68) é a série de Laurent ou 
expansão de Laurent de f(z). 

A utilização da linha de contorno (Figura 6.15) é conveniente para converter a região anular em uma região 
simplesmente conexa. Uma vez que nossa função é analítica nessa região anular (e de valor único), a linha de 
contorno não é essencial e, de fato, não aparece no resultado final, Equação (6.69). 

Os coeficientes da série de Laurent não precisam resultar da avaliação de integrais de contorno (que podem ser 
muito intratáveis). Outras técnicas, tais como expansões de séries ordinárias, podem fornecer os coeficientes. 

Numerosos exemplos de séries de Laurent aparecem no Capítulo 7. Aqui, limitamo-nos a um exemplo simples 
para ilustrar a aplicação da Equação (6.68). 


Exemplo 6.5.1 EXPANSÃO DE LAURENT 
Seja f(z) = [z(z — 1)]7t. Se escolhermos zo = 0, então r = 0 e R = 1, f(z) diverge em z = 1. Uma expansão 
fracionária parcial resulta na série de Laurent 


1 1 1 1 
= = 1 Ps Epi 7 
z(z— 1) l-z z z Ge 27 (N) 


Pelas Equações (6.70), (6.68) e (6.69), temos, então, 


1 dz —1 paran > -—1, 
an= Sri f (er — 1) i 0 paran < —1. (6-71) 


As integrais na Equação (6.71) também podem ser avaliadas diretamente substituindo a expansão de série 
geométrica de (1 — 2)! já utilizada na Equação (6.70) para (1 — 2)! 


—1 pio a 
an = sm PD je (6.12) 


Permutando a ordem de somatório e integração (série uniformemente convergente), temos 


= LS fo arc (6.73) 


m=0 


Se empregarmos a forma polar, como na Equação (6.47) (ou compare com o Exercício 6.4.1), 
10 
rie™ dg 
An = “Pri 2 f rn+2— meil (n+2—-m)0 


1 
Seg m 5 ERR (6.74) 


ni 


m=0 
que está de acordo com a Equação (6.71). E 


A série de Laurent difere da série de Taylor pela característica óbvia das potências negativas de (z — zo). Por 
essa razão, a série de Laurent sempre divergirá ao menos em z = 29 e talvez até tão longe quanto alguma distância 
r (Figura 6.15). 


Substitua n por —n em S2 e some. 


ELSEVIER 
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Exercícios 


6.5.1 


6.5.3 


6.5.5 


6.5.7 


6.5.9 


6.5.10 


Desenvolva a expansão de Taylor de In(1 + 2). 


Derive a expansão binomial 


m m(m — 1) — Mn 
(1+2) temos MES (1): 


n=0 


para m qualquer número real. A expansão é convergente para |z| < 1. Por quê? 


Uma função f(z) é analítica sobre e dentro do círculo unitário. Além disso, | f (z)| < 1 para |z| < 1 
e f(0) = 0. Mostre que | f(z)| < |z| for |z| < 1. 

Sugestão: Uma abordagem é mostrar que f(z)/z é analítica e então expressar [f(z0)/z0]” pela 
fórmula integral de Cauchy. Finalmente, considere grandezas absolutas e tome a enésima raiz. Esse 
exercício costuma ser chamado de teorema de Schwarz. 

Se f(z) é uma função real da variável complexa z = x + iy, isto é, se f(x) = f*(a), e a expansão 
de Laurent em torno da origem, f(z) = 3) anz”, tiver an = 0 para n < —N, mostre que todos os 
coeficientes a, são reais. 

Sugestão: Mostre que zN f(z) é analítica (via teorema de Morera, Seção 6.4). 

Uma função f(z) = u(x, y)+iv(zx, y) satisfaz as condições para o princípio da reflexão de Schwarz. 
Mostre que 

(a) u é uma função par de y. (b) v é uma função ímpar de y. 

Uma função f(z) pode ser expandida em uma série de Laurent em torno da origem com os 
coeficientes a, reais. Mostre que o conjugado complexo dessa função de z é a mesma função do 
conjugado complexo de z; isto é, 


Verifique isso explicitamente para 
(a) f(z) = 2”, n um inteiro, (b) f(z) = sen z. 
Se f(z) = iz (ay = 1), mostre que a afirmação precedente não é válida. 
A função f(z) é analítica em um domínio que inclui o eixo real. Quando z é real (z = x), f(x) é 
imaginário puro. 
(a) Mostre que 
FK) = —[H2)) 
(b) Para o caso específico f(z) = iz, desenvolva formas cartesianas de f(z), f(2*), e f*(z). Não 
cite o resultado geral da parte (a). 


Desenvolva os três primeiros termos não-zero da expansão de Laurent de 


z = 

Ho) =(€—1) 
em torno da origem. Note a semelhança com a função geradora do número de Bernoulli, 
Equação (5.144) da Seção 5.9. 


Prove que a expansão de Laurent de uma dada função em torno de um ponto dado é única; isto é, se 


f(2) = 5 an(z — zo)” = 5 bn(z — 20)”, 


n=—N n=—N 


mostre que a, = bn para todo n. 
Sugestão: Use a fórmula integral de Cauchy. 


(a) Desenvolva uma expansão de Laurent de f(z) = [z(z — 1)]"! em torno do ponto z = 1 
válida para valores pequenos de |z — 1|. Especifique a faixa exata sobre a qual sua expansão 
é válida. Essa é uma continuação analítica da Equação (6.70). 
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(b) Determine a expansão de Laurent de f(z) em torno de z = 1, mas para |z — 1| grande. 
Sugestão: Fracione essa função parcialmente e use a série geométrica. 


6.5.11 (a) Dada fi(z) = FR e * dt (com t real), mostre que o domínio no qual f(z) existe e é analítica 
é R(z) > 0. 
(b) Mostre que f>(z) = 1/z é iguala fi(z) sobre R(z) > 0 é iguala fi(z) sobre todo o plano z, 
exceto para z = 0. 
(c) Expanda 1/z em torno do ponto z = i. Você terá f3(z) = Jyo an(z — i)”. Você terá fa(2)? 
1 > n A dy 
Resposta: F =>. (2— 0)”, z—il<l. 


n=0 


6.6 Singularidades 


A expansão de Laurent representa uma generalização da série de Taylor na presença de singularidades. Definimos 
o ponto zo como um ponto singular isolado da função f(z) se f(z) não for analítica em z = zo mas for analítica 
em todos os pontos vizinhos. 


Pólos 
Na expansão de Laurent de f(z) em torno de zo, 


OO 


F(= Sano 2)”, (6.75) 


m= — oo 


se am = 0 para m < —n < 0 e a-n £ 0, dizemos que zo é um pólo de ordem n. Por exemplo, se n = 1, isto é, se 
a—ı/(z— zo) é O primeiro termo que não desaparece na série de Laurent, temos um pólo de ordem 1, que costuma 
ser denominado pólo simples. 

Se, por outro lado, o somatório continuar até m = —oo, então zo é um pólo de ordem infinita e é denominado 
singularidade essencial. Essas singularidades essenciais têm muitas características patológicas. Por exemplo, 
podemos mostrar que em qualquer pequena vizinhança de uma singularidade essencial de f(z) a função f(z) 
chega arbitrariamente próxima de qualquer (e, portanto, de toda) quantidade complexa pré-selecionada w,.!º Aqui, 
todo o plano w é mapeado por f para a vizinhança do ponto zo. Um ponto de fundamental diferença entre um pólo 
de ordem finita n e uma singularidade essencial é que, multiplicando f(z) por (z — zo)”, f(z)(z — zo)”, já não é 
mais singular em 20. É óbvio que isso não pode ser feito para uma singularidade essencial. 

O comportamento de f(z), à medida que z — oo, é definido em termos do comportamento de f(1/t), à medida 
que t > 0. 

Considere a função 
Oo (— 1 ) n z2n+ 1 


Re DO a 


n=0 


(6.76) 


À medida que z — 00, substituímos z por 1 /t para obter 


1 O (198 


n=0 


Pela definição, sen z tem uma singularidade essencial no infinito. Esse resultado podia ser antecipado pelo 
Exercício 6.1.9, uma vez que 


sen z = sen ty = isenh y, quando x = 0, 


e se aproxima exponencialmente do infinito, à medida que y — co. Assim, embora o valor absoluto de sen x para 
x real seja igual ou menor do que a unidade, o valor absoluto de sen z não é limitado. 

Uma função que é analítica em todo o plano complexo finito, exceto em pólos isolados, é denominada 
meromórfica, tais como as razões entre dois polinômios ou tg z, cot z. Outros exemplos são funções inteiras 
que não têm singularidades no plano complexo finito, tais como exp(z), sen z, cos z (veja as Seções 5.9 e 5.11). 


Esse teorema se deve a Picard. Uma prova é dada por E. C. Titchmarsh, The Theory of Functions, 2%. ed. Nova York: Oxford University 
Press (1939). 
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Pontos de Ramificação 
Há outro tipo de singularidade que será importante no Capítulo 7. Considere 


fg) = 2", 
na qual a não é um inteiro.! À medida que z percorre o círculo unitário de eº a e?™*, 
F(z) e. er + eve = 1, 


para a não-inteiro. Temos um ponto de ramificação na origem e outro no infinito. Se estabelecermos z = 1/t, 
uma análise similar de f(z) para t — 0 mostra que t = 0; isto é, z = oo também é um ponto de ramificação. Os 
pontos e% e e27* no plano z coincidem, mas esses pontos coincidentes levam a valores diferentes de f(z); isto 
é, f(z) é uma função de valor múltiplo. O problema é resolvido construindo uma linha de corte que une ambos 
os pontos de ramificação, de modo que f(z) será unicamente especificada para um dado ponto no plano z. Para 
2º, a linha de corte pode partir em qualquer ângulo. Note que, aqui, o ponto no infinito também deve ser incluído; 
isto é, a linha de corte pode unir pontos de ramificação finitos via o ponto no infinito. O próximo exemplo é desses 
casos. Se a = p/q é um número racional, então q é denominado ordem do ponto de ramificação, porque é preciso 
circundar o ponto de ramificação q vezes antes de voltar ao ponto de partida. Se a for irracional, então a ordem do 
ponto de ramificação é infinita, exatamente como no logaritmo. 

Note que uma função com um ponto de ramo e uma linha de corte requerida não será contínua através da linha 
de corte. Muitas vezes haverá uma diferença de fase em lados opostos dessa linha de corte. Por conseguinte, as 
integrais de linha em lados opostos dessa linha de corte de ponto de ramo em geral não se cancelarão mutuamente. 
Numerosos exemplos desse caso aparecem nos exercícios. 

A linha de contorno usada para converter a região multiplamente conexa em uma região simplesmente conexa 
(Seção 6.3) é completamente diferente. Nossa função é contínua através daquela linha de contorno, e não existe 
nenhuma diferença de fase. 


Exemplo 6.6.1 PONTOS DE RAMIFICAÇÃO DE ORDEM 2 
Considere a função 
F) = (2-1? = (2 + 2-2, (6.78) 


O primeiro fator do lado direito, (z + 1)" 2, tem um ponto de ramificação em z = —1. O segundo fator tem um 
ponto de ramificação em z = +1. No infinito f(z) tem um pólo simples. Pode-se ver melhor isso substituindo 
z = 1/t e fazendo uma expansão binomial em t = 0: 


2 1/2 1 2) 1/2 1 — 1/2 ny42n l l 1 
(2-2 =10-2) 5 (e Pn a a 
n=0 

A linha de corte tem de conectar ambos os pontos de ramificação, portanto não é possível circundar completamente 
qualquer dos pontos de ramificação. Para verificar a possibilidade de tomar o segmento de linha que une z = +1 
ez = —1 como uma linha de corte, vamos seguir as fases desses dois fatores enquanto percorremos o contorno 
mostrado na Figura 6.16. 

Por conveniência, nas mudanças de fase a seguir sejam z + 1 = re? e z — 1 = pe'?. Então a fase de f(z) é 
(8 + )/2. Começamos no ponto 1, onde ambos, z + 1 e z — 1, têm uma fase nula. Passando do ponto 1 para o 
Q, a fase de z — 1 = pet? aumenta de 7 (z — 1 se torna negativo). Então y permanece constante até que o círculo 
seja concluído, passando de 6 para 7. 0, a fase de z + 1 = ret?, mostra um comportamento similar, aumentando 
de 27, à medida que passamos de 3 para 5. A fase da função f(z) = (z + 1)//2(z — 1)1/2 = q1/2 p1/2ei(0+9)/2 é 
(0 + 7) /2. Isso está tabulado na última coluna da Tabela 6.1. 


0 


16% — 0 é um ponto singular, porque z7 tem somente um número finito de derivadas, ao passo que uma função analítica tem garantido um 


número infinito de derivadas (Seção 6.4). O problema é que f(z) não é de valor único, à medida que circundamos a origem. A fórmula integral 
de Cauchy não pode ser aplicada. 
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Figura 6.16: Domínio circular para a expansão de Taylor. 


Tabela 6.1 Ângulo de fase 


TF 
Ponto 0 p Em 
1 0 0 0 
2, 0 T 5 
3 0 T E 
4 T T T 
37 
5 27 T E 
6 27 T ar 
7 27 27 27 


Surgem duas características: 

1. A fase nos pontos 5 e 6 não é a mesma que a fase nos pontos 2 e 3. Esse comportamento pode ser esperado 
em um corte de ramificação. 

2. A fase no ponto 7 excede a do ponto 1 de 27, e, portanto, a função f(z) = (22 — 1)!/2 é de valor único para 
o contorno mostrado, circundando ambos os pontos de ramificação. 

Se considerarmos o eixo —1 < a < 1, f(z), por ser uma linha de corte, é unicamente especificada. 
Alternativamente, o eixo positivo x, para x > 1, e o eixo negativo x, para x < —1, podem ser tomados como 
linhas de corte. Os pontos de ramificação não podem ser circundados e a função permanece de valor único. Na 
verdade, essas duas linhas de corte são um único corte de ramificação de —1 a +1 via o ponto no infinito. E 


Generalizando por esse exemplo, temos que a fase de uma função 


FD = falo) - faz) - falo) --- 


é a soma algébrica das fases de seus fatores individuais: 


arg f(z) = arg fi(z) + arg fo(z) + arg fa(z) + e: 


A fase de um fator individual pode ser considerada como o arco tangente da razão entre sua parte imaginária e sua 
parte real (escolhendo o ramo adequado da função arco tangente tg !y/x, que tem infinitamente muitos ramos). 
1 [ Vi 
arg fi(z) = tg (=) | 
ui 
Para o caso de um fator da forma 
filz) = (2 — 20), 
a fase corresponde ao ângulo de fase de um vetor bidimensional de +z9 a z, sendo que a fase aumenta de 27, à 


medida que o ponto +-z9 é circundado. Ao contrário, percorrer qualquer circuito fechado que não circunde 29 não 
muda a fase de z — 20. 


Exercícios 


6.6.1 A função f(z) expandida em uma série de Laurent exibe um pólo de ordem m em z = zo. Mostre 
que o coeficiente de (z — 29) !,a. 1, é dado por 


1 dm—1 
a-1 = (m TE 1)! dz™m—1 [(2 z0)” f (2)] 2=20" 
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a = [(2 -= 2) f(2)] pa 


quando o pólo é um pólo simples (m = 1). Essas equações para a—ı são de extrema utilidade para 
determinar o resíduo a ser usado no teorema do resíduo da Seção 7.1. 

Sugestão: A técnica que foi tão bem-sucedida para provar a unicidade da série de potências, Seção 
5.7, também funcionará aqui. 


6.6.2 Uma função f(z) pode ser representada por 
_ Al 
f)’ 


na qual fı(z) e f2(z) são analíticas. O denominador, f2(z), desaparece em z = zo, mostrando que 
f(z) tem um pólo em z = zo. Contudo, fi(zo) £ 0, f4(z0) £ O. Mostre que a—1, o coeficiente de 
(z — zo)! em uma expansão de Laurent de f(z) em z = zo, é dado por 


a _ Alz) 
= a 


(Esse resultado leva ao teorema da expansão de Heaviside, Exercício 15.12.11.) 


f(z) 


6.6.3 Por analogia com o Exemplo 6.6.1, considere em detalhe a fase de cada fator e a fase global 
resultante de f(z) = (z? + 1)!/2 percorrendo um contorno similar ao da Figura 6.16, mas 
circundando os novos pontos de ramificação. 


6.6.4 A função de Legendre da segunda espécie, Q,(z), tem pontos de ramificação em z = +1. Os 
pontos de ramo são unidos por uma linha de corte ao longo do eixo (x) real. 


(a) Mostre que Qo(z) = 5 In((z + 1)/(z — 1)) é de valor único (sendo o eixo real —1 < x < 1 
tomado como uma linha de corte). 


(b) Para argumento real x e |x| < 1, é conveniente considerar 


1, 1+4 
2 1-g 


Mostre que 
Qola) = 5 [Ola + 0) + Qu(a — 10)] 


Aqui, x + i0 indica que z se aproxima do eixo real por cima e x — i0 indica uma aproximação 
por baixo. 
6.6.5 Como exemplo de uma singularidade essencial, considere e!/* 


zero. Para qualquer número complexo zo, zo Æ 0, mostre que 


, à medida que z se aproxima de 


tem um número infinito de soluções. 


6.7 Mapeamento 
Nas seções precedentes definimos funções analíticas e desenvolvemos algumas de suas características principais. 
Nesta seção introduzimos alguns dos aspectos mais geométricos de funções de variáveis complexas, aspectos que 
serão úteis para visualizar as operações integrais no Capítulo 7 e que são valiosas por mérito próprio para resolver 
a equação de Laplace em sistemas bidimensionais. 

Em geometria analítica comum podemos considerar y = f(x) e então traçar y versus x. Aqui, nosso problema 
é mais complicado, porque z é uma função de duas variáveis, x e y. Usamos a notação 


w = f(z) = u(x, y) + iv(x, y). (6.79) 


Então, para um ponto no plano z (valores específicos para x e y) podem corresponder valores específicos para 
u(x, y) e v(x, y) que então podem resultar em um ponto no plano w. À medida que pontos no plano z se 
transformam ou são mapeados para pontos no plano w, linhas ou áreas no plano z serão mapeadas para linhas 
ou áreas no plano w. Nossa finalidade imediata é ver como linhas e áreas são mapeadas do plano z para o plano w 
para várias funções simples. 
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Translação 
w = z + 2%. (6.80) 


A função w é igual à variável z mais uma constante, 29) = £o + tyo. Pelas equações (6.1) e (6.79), 
u = z% + To, v = yY + Yo, (6.81) 


o que representa uma translação pura de eixos coordenados, como mostra a Figura 6.17. 


y v 
Z w 
(uy v) 
(1 YD 
0 > x > u 
Figura 6.17: Translação. 
Rotação 
w = zzo. (6.82) 
Aqui é conveniente voltar à representação polar usando 
w = pe'?, z= re? e 20 = roe'%, (6.83) 
então, 
pe? = rroetl +2). (6.84) 
ou 
p = TT0, g =0+ 0. (6.85) 


Duas coisas ocorreram. Primeiro, o módulo r foi modificado, ou seja, expandido ou contraído, pelo fator ro. 
Segundo, o argumento 0 foi aumentado pela constante aditiva do (Figura 6.18). Isso representa uma rotação da 
variável complexa através de um ângulo 89. Para o caso especial de zo = i, temos uma rotação pura através de 7/2 
radianos. 


> 

x 
> 

S 


P= 


(0, 1) 


© 
A 
dm 
© 
© 

© 


P=0+0 


Figura 6.18: Rotação. 
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Inversão 1 
w=-. (6.86) 
A 


Novamente, usando a forma polar, temos 
pe? = — = e”, (6.87) 
que mostra que 
p=-, p=-0. (6.88) 


A primeira parte da Equação (6.87) mostra aquela inversão claramente. O interior do círculo unitário é mapeado 
para o exterior e vice-versa (Figura 6.19). Além disso, a segunda parte da Equação (6.87) mostra que o sinal do 
ângulo polar é invertido. Por conseguinte, a Equação (6.88) também envolve uma reflexão do eixo y, exatamente 
como a equação do conjugado complexo. 


e 


(0, 1) 


E 


Figura 6.19: Inversão. 


Para ver como curvas no plano z se transformam para o plano w, voltamos à forma cartesiana: 


(6.89) 


u+ iv = A 
x+y 


Racionalizando o lado direito pela multiplicação do numerador e do denominador por z* e então igualando as 
partes reais e as partes imaginárias, temos 


x u 


= —— £ = —— 
z2 +y?’ u? +ou?’ 
y a (6.90) 
is L? +y Y=- u2 Fv 
Um círculo com centro na origem no plano z tem a forma 
rL +y =r? (6.91) 
e pelas Equações (6.90) se transforma em 
u? v? 5 
Ea 6.92 
(u2 + v2)? + (u2 + v2)? r (6.92) 
Simplificando a Equação (6.92), obtemos 
1 
Pte, (6.93) 
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que descreve um círculo no plano w também com centro na origem. 
A reta horizontal y = cy se transforma em 


—u 
TES C1, (6.94) 
ou 
2 
1 1 
2 
u +|v+tz] = , 6.95 
(+a) Tr 655 
que descreve um círculo no plano w de raio (1/2c1) e com centro em u = 0, v = — 3 (Figura 6.20). 
y 
A 
z 
v 
4 
w 
WE 1 2 3 4 
+ + H t > 
4 
DDD ++ x u 
3 
2 
1 
(o-z) |! 
Figura 6.20: Inversão reta — círculo. 
Apanhamos as outras três possibilidades, x = +cy,y = —ci, rotacionando os eixos xy. Em geral, qualquer 


linha reta ou círculo no plano z se transformará em uma linha reta ou um círculo no plano w (compare com o 
Exercício 6.7.1). 


Pontos de Ramificação e Funções Multivalentes 
Todas as três transformações que acabamos de discutir envolveram correspondência um-para-um de pontos no 
plano z para pontos no plano w. Agora, para ilustrar a variedade de transformações que são possíveis e os 
problemas que podem surgir, introduzimos, em primeiro lugar, uma correspondência dois-para-um e em seguida 
uma correspondência muitos-para-um. Por fim, consideramos as inversas dessas duas transformações. 
Considere primeiro a transformação 
w = z2, (6.96) 


que leva a 

per;  p=2. (6.97) 
É claro que nossa transformação é não-linear porque o módulo está elevado ao quadrado, mas a característica 
significativa da Equação (6.96) é que o ângulo de fase ou argumento é duplicado. Isso significa que: 
e primeiro quadrante de z, 0 < 0 < > — semiplano superior de w,0 < Y < T, 
e semiplano superior de z, 0 < 0 < 7, — todo o plano de w, 0 < py < 27. 


O semiplano inferior de z mapeia para todo o plano de w já coberto e, por isso, cobre o plano w uma segunda vez. 


Essa é a nossa correspondência dois-para-um, isto é, dois pontos distintos no plano 29 e zoet = — zo correspondem 
a um único ponto w = 22. 


Em representação cartesiana, 


u + iv = (x + iy} = r? — y? + iZay, (6.98) 
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levando a 
u= zr? -—y?, v=2ay. (6.99) 


Por conseguinte, as retas u = c;,v = c2 no plano w correspondem a z? — y? = c,,21y = c2, hipérboles 
retangulares (ortogonais) no plano z (Figura 6.21). A todo ponto sobre a hipérbole no semiplano direito, x? — y? = 
cı corresponde um ponto sobre a reta x > 0 e vice-versa. Contudo, todo ponto sobre a reta u = cı também 
corresponde a um ponto sobre a hipérbole u = cı no semiplano esquerdo, x? — y? = cy, como já explicamos. 


Figura 6.21: Mapeamento — coordenadas hiperbólicas. 


Na Seção 6.8 mostraremos que, se retas no plano w são ortogonais, as retas correspondentes no plano z também 
são ortogonais, contanto que a transformação seja analítica. Uma vez que u = cı ev = cz sejam construídas como 
perpendiculares entre si, as hipérboles correspondentes no plano z são ortogonais. Construímos um novo sistema 
ortogonal de linhas hiperbólicas (ou superfícies, se adicionarmos um eixo perpendicular a x e y). O Exercício 
2.1.3 foi uma análise desse sistema. Deve-se notar que, se as linhas hiperbólicas forem linhas de força elétrica ou 
magnética, então temos uma lente quadripolar útil para focalizar raios de partículas de alta energia. 

O inverso da quarta transformação (Equação (6.96)) é 


irala; (6.100) 
Pela relação l , 
pe'? ps r1/2et8/2 (6.101) 
e 
2% = 0, (6.102) 


agora temos dois pontos no plano w (argumentos y e p + 7) correspondentes a um ponto no plano z (exceto para 
o ponto z = 0). Ou, em outras palavras, 0 e 0 + 27 correspondem a y e y + 7, dois pontos distintos no plano w. 
Essa é a variável complexa análoga à simples equação de variável real 2 = x, na qual dois valores de y, um com 
sinal mais, outro com sinal menos, correspondem a cada valor de zx. 

Aqui, a questão importante é que podemos fazer da função w da Equação (6.100) uma função de valor único, 
em vez de uma função de valor duplo, se concordarmos em restringir 0 a uma faixa, tal como O < 0 < 27. Isso 
pode ser feito concordando em nunca cruzar a reta O = 0 no plano z (Figura 6.22). Essa linha de demarcação é 
denominada linha de corte ou corte de ramificação. Note que pontos de ramificação ocorrem em pares. 

A linha de corte une as duas singularidades do ponto de ramificação, aqui em O e infinito (para o último, 
transforme z = 1/t para t — 0). Qualquer reta de z = O a infinito serviria igualmente bem. A finalidade da 
linha de corte é restringir o argumento de z. Os pontos z e z exp(2ri) coincidem no plano z mas resultam pontos 
diferentes w e —w = w exp(7%) no plano w. Daí, na ausência de uma linha de corte, a função w = 2/2 é ambígua. 
Alternativamente, uma vez que a função w = z!/2 é de valor duplo, também podemos colar duas folhas do plano 
complexo z ao longo do corte de ramo de modo que arg(z) possa crescer mais do que 27 ao longo do corte de 
ramificação e continue, de 47 em diante, na segunda folha para alcançar os mesmos valores de função para z 
que alcançou para ze *7*, isto é, o ponto de partida na primeira folha novamente. Essa construção é denominada 
superfície de Riemann de w = z!/2. Encontraremos pontos de ramificação e linhas de corte (cortes de ramo) com 
frequência no Capítulo 7. 

A transformação 

w = e? (6.103) 
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VA Linha de corte 


> x 


Figura 6.22: Uma linha de corte. 


leva a 
pe? = eti (6.104) 


Se y varia de 0 < y < 2r (ou —r < y < T), então y abrange a mesma faixa. Mas isso é todo o w. Em outras 
palavras, a tira horizontal no plano z de largura 27 mapeia para o plano w inteiro. Além disso, qualquer ponto 
x + ily + 2n7), no qual n seja qualquer inteiro, mapeia para o mesmo ponto (pela Equação (6.104)) no plano w. 
Temos uma correspondência muitos-(infinitamente muitos)-para-um. 

Por fim, como a inversa da quinta transformação (Equação (6.103)), temos 


w= lnz. (6.105) 
Expandindo-a, obtemos 


u+ iv = lnre? = lnr + ið. (6.106) 


Para um dado ponto zo no plano z o argumento 0 é inespecífico dentro de um múltiplo inteiro de 27. Isso significa 
que 
v=0+2n7, (6.107) 


e, assim como na transformação exponencial, temos uma correspondência infinitamente muitos-para-um. 

A Equação (6.108) tem uma bela representação física. Se percorrermos o círculo unitário no plano z, r = 1, e 
pela Equação (6.107), u = lnr = 0; mas v = 0, e 0 está crescendo continuamente e continua a crescer quando 6 
vai além de 27. 

A linha de corte se une ao ponto de ramificação na origem com o infinito. Quando 6 aumenta e ultrapassa 27, 
colamos uma nova folha do plano complexo z ao longo da linha de corte etc. Percorrer o círculo unitário no plano 
z é como apertar um parafuso ou subir uma escada em espiral (Figura 6.23), que é a superfície de Riemann de 
w= lnz. 

Assim como no exemplo precedente, também podemos fazer com que a correspondência seja única (e a 
Equação (6.106) não-ambígua), restringindo 0 a uma faixa, tal como O < 6 < 27, tomando a reta 0 = 0 (eixo real 
positivo) como uma linha de corte. Isso equivale a subir um, e somente um, lance completo da escada em espiral. 

O conceito de mapeamento é muito amplo e útil na matemática. Nosso mapeamento de um plano complexo 
z para um plano complexo w é uma simples generalização de uma das definições de função: um mapeamento 
de x (de um conjunto) para y em um segundo conjunto. Uma forma mais sofisticada de mapeamento aparece na 
Seção 1.15 usamos a função delta de Dirac ó(x — a) para mapear uma função f(x) para seu valor no ponto a. No 
Capítulo 15 onde são usadas transformadas integrais para mapear uma função f(x) no espaço x para uma segunda 
função F(t) (relacionada ) no espaço t. 


Exercícios 
6.7.1 Como círculos com centro na origem no plano z se transformam em 


ELSEVIER 
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6.7.2 


6.7.3 


6.7.4 


6.7.5 


6.7.6 


6.7.7 


6.7.8 


X 


0 


Figura 6.23: Essa é a superfície de Riemann para In z, uma função de valor múltiplo. 


(a) wi(z) = z + 2 (b) wa(z) = z — a para z £ 0? 


O que acontece quando |z| — 1? 


Que parte do plano z corresponde ao interior do círculo unitário no plano w se 


z Z—4 
(a) w o (b) w E 
Discuta as transformações 
(a) w(z) = sen z, (c) w(z) = senh z, 


(b) w(z) = cos z, (d) w(z) = cosh z. 


Mostre como as retas £ = cy, Y = ca mapeiam para o plano w. Note que as últimas três 
transformações podem ser obtidas da primeira por translação e/ou rotação adequada. 


Mostre que a função 
w(z) = (22 — 1) ne 


é de valor único se considerarmos —1 < x < 1, y = 0 como uma linha de corte. 
Mostre que números negativos têm logaritmos no plano complexo. Em particular, ache In(— 1). 
Resposta: In(—1) = ir. 


Uma representação integral da função de Bessel segue o contorno no plano t mostrado na 
Figura 6.24. Mapeie esse contorno para o plano O com t = e”. Muitos exemplos adicionais de 
mapeamento são dados nos Capítulos 11, 12 e 13. 


Para m não-inteiro, mostre que a expansão binomial do Exercício 6.5.2 é válida somente para um 
ramo adequadamente definido da função (1 + 2)”. Mostre como o plano z é cortado. Explique por 
que |z| < 1 pode ser considerado como o círculo de convergência para a expansão desse ramo, à 
luz do corte que você escolheu. 


A expansão de Taylor dos Exercícios 6.5.2 e 6.7.7 não é adequada para ramos que não sejam aquele 
ramo da função (1 + z)” definido adequadamente para m não-inteiro. [Note que outros ramos não 
podem ter a mesma expansão de Taylor, já que devem ser distinguíveis.] Usando o mesmo corte 
de ramificação dos exercícios anteriores para todos os outros ramos, ache as expansões de Taylor 
correspondentes, detalhando as atribuições de fase e coeficientes de Taylor. 
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plano t 


6 — 5 
1 => 2 4 — 3 
E 


Figura 6.24: Contorno de integração da função de Bessel. 


6.8 Mapeamento Conformal 


Na Seção 6.7, hipérboles foram mapeadas para retas e retas foram mapeadas para círculos. Ainda assim, em todas 
essas transformações, uma característica permaneceu constante. Essa constância foi um resultado do fato de que 
todas as transformações da Seção 6.7 foram analíticas. 

Contanto que w = f(z) seja uma função analítica, temos 


df? dw Aw 


dz dz ai Az (8:108) 


Admitindo que essa equação está em forma polar, podemos igualar módulo a módulo e argumento a argumento. 
Para o último (admitindo que the df /dz # 0), 


A 
arg lim DO = lim arg — 
Az>0 Az Az>0 Az 


sui E 
= imo arg Aw — Aim arg Az = arg a (6.109) 


em que a, o argumento da derivada, pode depender de z, mas é uma constante para um z fixo, independente 
da direção de aproximação. Para perceber o significado disso, considere duas curvas C, no plano z e a curva 
correspondente Cw no plano w (Figura 6.25). O incremento Az é mostrado em um ângulo de 0 em relação ao 
eixo (x) real, ao passo que o incremento Aw correspondente forma um ângulo de y com o eixo real (u). Pela 
Equação (6.110), 


y C: 


Figura 6.25: Mapeamento conformal — preservação de ângulos. 


p=0+a, (6.110) 


4 


ou qualquer reta no plano z é rotacionada através de um ângulo œ no plano w, contanto que w seja uma 
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transformação analítica e a derivada não seja zero.” 


Uma vez que esse resultado é válido para qualquer reta que passe por zo, ele será válido para um par de retas. 
Então, para o ângulo entre essas duas retas, 


Pə — Pı = (f2 +a) — (01 + a) = 02 — 01, (6.111) 


o que mostra que o ângulo incluído é preservado sob uma transformação analítica. Essas transformações que 
preservam ângulos são denominadas conformes. A rotação de um ângulo a em geral dependerá de z. Além disso, 
|f'(z)| será usualmente uma função de z. 

Historicamente essas transformações conformes têm sido de grande importância para cientistas e engenheiros na 
resolução da equação de Laplace para problemas de eletrostática, hidrodinâmica, fluxo de calor, e assim por diante. 
Infelizmente, a abordagem da transformação conforme, embora elegante, é limitada a problemas que podem ser 
reduzidos a duas dimensões. O método costuma ser belo se houver alto grau de simetria presente, mas muitas vezes 
é impossível se a simetria for rompida ou não existir. Por causa dessas limitações e primordialmente porque os 
computadores eletrônicos oferecem uma alternativa útil (solução iterativa da equação diferencial parcial), omitimos 
os detalhes e aplicações dos mapeamentos conforme. 


Exercícios 
6.8.1 Expanda w(x) em uma série de Taylor em torno do ponto z = zo, em que f'(z0) = 0. (Ângulos não 
são preservados.) Mostre que, se as primeiras n — 1 derivadas desaparecerem, mas f (1) (29) 0, 
então os ângulos no plano z com vértices em z = zo aparecem no plano w multiplicados por n. 


6.8.2 Desenvolva as transformações que criam cada um dos quatro sistemas de coordenadas cilíndricas: 

(a) Cilíndricas circulares: £ = p CoS f, 

y = psen q. 
(b) Cilíndricas elípticas: x = a cosh u cos v, 

y = asenh zusen v. 
(c) Cilíndricas parabólicas: xz = En, 

v= (nº — &). 

h 

(d) Bipolares: r= Ee 


— coshm— cos ê’ 
asen E 


cosh 7 — cos €` 
Nota: Essas transformações não são necessariamente analíticas. 


6.8.3 Na transformação 


za PR 


b) 
a + w 


como as retas coordenadas no plano z se transformam? Que sistema de coordenadas você construiu? 
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17Se df /dz = 0, seu argumento ou fase é indefinido e a transformação (analítica) não preservará necessariamente os ângulos. 
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Outras referências são dadas ao final do Capítulo 15. 
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Funções de uma Variável Complexa II 


Neste capítulo voltamos à análise iniciada com as condições de Cauchy-Riemann no Capítulo 6 e desenvolvemos o 
teorema dos resíduos com importantes aplicações na avaliação de integrais definidas e partes principais de integrais 
de interesse para cientistas e expansão assintótica de integrais pelo método da inclinação mais acentuada. Também 
desenvolvemos outras funções analíticas específicas, tais como expansões de pólos de funções meromórficas e 
expansões de produto de funções inteiras. Incluímos relações de dispersão porque elas representam uma importante 
aplicação de métodos de variável complexa para físicos. 


71 Cálculo de Resíduos 


Teorema dos resíduos 
Se a expansão de Laurent de uma função f(z) = 57. cc an(z — zo)” é integrada termo a termo usando um 


contorno fechado que circunda um ponto singular isolado zy uma vez em sentido anti-horário, obtemos (Exercício 
6.4.1) 


e n+1 |71 
an $(2- so) dz = e) =0, n#-l1. (1.1) 
n+1 2i 
Contudo, se n = —1, 
im pib do 
a fl-a d =a TE = 2ria_ı. (7.2) 
re! 
Resumindo as Equações (7.1) e (7.2), temos 
: f(z) dz = (1.3) 
ni zZ z = 0-1. . 


A constante a. 1, o coeficiente de (z — zo) ! na expansão de Laurent, é denominada resíduo de f(z) em z = 20. 
Um conjunto de singularidades isoladas pode ser tratado deformando nosso contorno, como mostra a Figura 7.1. 
O teorema integral de Cauchy (Seção 6.3) leva a 


f f(z) dz + f(z) dz + f(z) dz + flo) dz +---=0. (7.4) 
c Co Cı C2 
A integral circular ao redor de qualquer ponto singular determinado é dada pela Equação (7.3), 
$ f(z) dz = —2mia 1»; (7.5) 
Ci 


admitindo uma expansão de Laurent em torno do ponto z = z; singular. O sinal negativo vem da integração em 
sentido horário, como mostra a Figura 7.1. Combinando as Equações (7.4) e (7.5), temos 


$ FC) dz = 2rila izo + Gia Faia +*+) 
c 


= 2mi x (soma dos resíduos envolvidos). (7.6) 


345 
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Čs 
q 

Il 
pe 


a. 


Rz=x 


Figura 7.1: Excluindo singularidades isoladas. 


Esse é o teorema dos resíduos. O problema de avaliar uma ou mais integrais de contorno é substituído pelo 
problema algébrico de calcular resíduos nos pontos singulares envolvidos. 

Em primeiro lugar usamos esse teorema dos resíduos para desenvolver o conceito do valor principal de Cauchy. 
Então, no restante desta seção aplicamos o teorema dos resíduos a uma ampla variedade de integrais definidas de 
interesse matemático e físico. 

Usando a transformação z = 1/w para w tendendo a 0, podemos achar a natureza de uma singularidade em 
z tendendo ao infinito e o resíduo de uma função f(z) com apenas singularidades isoladas e nenhum ponto de 
ramificação. Nesses casos sabemos que 


X {resíduos no plano z finito} + {resíduos em z > œ} = 0. 


Valor Principal de Cauchy 
Ocasionalmente, um pólo isolado estará diretamente sobre o contorno de integração, fazendo com que a integral 
divirja. Vamos ilustrar um caso físico. 


Exemplo 7.1.1 OSCILADOR FORÇADO CLÁSSICO 
A equação diferencial não-homogênea para um oscilador harmônico forçado clássico, não-amortecido, 


Ë(t) + wo x(t) = f(t), (7.7) 


pode ser resolvida representando a força impulsora f(t) = f (t —t) f(t") dt como uma superposição de impulsos 
por analogia com uma distribuição de carga estendida em eletrostática.! Se resolvermos em primeiro lugar a 
equação diferencial mais simples 


ÖĞ + w2G = ô(t — t’) (1.8) 


para G(t, t), que é independente do termo de impulsão f(dependente do modelo), então x(t) = f G(t,t) f(t) dt” 
resolve o problema original. Em primeiro lugar verificamos isso substituindo as integrais para x(t) e suas 
derivadas temporais na equação diferencial para x(t) usando a equação diferencial para G. Então procuramos 
G(tt) =f G(u) e'teé da em termos de uma integral ponderada por G, que é sugerida por uma forma integral 
similar para ô(t — t') = f e-t) de (veja a Equação (1.193c) na Seção 1.15). 

Ao substituir G e G na equação diferencial para G, obtemos 


f [hw — w)6 — et Jet dw =0. (7.9) 


Como essa integral é zero para todo t, a expressão entre colchetes deve desaparecer para todo w. Essa relação não 
é mais uma equação diferencial, mas uma relação algébrica que podemos resolver para G: 

ERR: ER? ERRA 
—iwt eTiut eTiut 


RUS wg — w? = 2wolw +wo) 2wolw — wo). (IO 


! Adaptado de A. Yu. Grosberg, priv. comm. 
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Substituir G na integral para G resulta em 


1 œ Fuiw(t—t”) iw(t—t”) 
Gt, t) = / É Í dw. (AS) 


47w0 w + wo wW — wo 


— 00 


Aqui, a dependência de G de t — t’ na exponencial é consistente com a mesma dependência de (t — t’), seu termo 
de impulsão. Agora, o problema é que essa integral diverge porque o integrando aumenta muito em w = +wo, 
uma vez que a integração passa diretamente pelo pólo de primeira ordem. Para explicar por que isso acontece, 
notamos que o termo de impulsão da função ô para G inclui todas as frequências com a mesma amplitude. Em 
seguida, vemos que o termo de impulsão da equação para Gemt' =0é igual à unidade para todas as fregiiências 
w, incluindo o wọ ressonante. Sabemos pela física que forçar um oscilador a entrar em ressonância leva a uma 
amplitude indefinidamente crescente se não houver nenhum atrito. Com atrito, a amplitude permanece finita, 
mesmo em ressonância. Isso sugere a inclusão de um termo de pequeno atrito nas equações diferenciais para 
a(t) e G. 

Com um termo de pequeno atrito nG,n > 0, na equação diferencial para G(t,t') (e ni para a(t)), ainda 
podemos resolver a equação algébrica 


(w? — w? + imo) É = e7" (7.12) 


para É com atrito. A solução é 


É = (7.13) 


(7.14) 


Para pequeno atrito, 0 < n < wo, Q é quase igual a wọ e real, ao passo que cada w+ fica acrescido de uma pequena 
parte imaginária. Isso significa que a integração da integral para G, 


ê ; 1 œ Foiw(t—t”) eiu(t=t”) ? PT 
bl )= . 

tu, mm / | | ai fio) 
não encontra mais um pólo e permanece finita. E 


Esse tratamento de uma integral com um pólo retira o pólo do contorno e então considera o comportamento no 
limite quando ele é trazido de volta, como no Exemplo 7.1.1 para n — 0. Esse exemplo também sugere tratar w 
como uma variável complexa no caso de singularidade ser um pólo de primeira ordem, deformando o caminho de 
integração para evitar a singularidade, o que equivale a adicionar uma pequena parte imaginária à posição do pólo 
e avaliar a integral por meio do teorema dos resíduos. 

Por conseguinte, se o caminho da integração de uma integral -E - para xo real passar exatamente pelo 
pólo xo, podemos deformar o contorno para incluir ou excluir o resíduo, como desejado, incluindo um desvio 
semicircular de raio infinitesimal. Isso é mostrado na Figura 7.2. Então, a integração sobre o semicírculo resulta 
em, com z — xy = de'?, dz = i ôe? dy (veja a Equação (6.27a)), 


27 
/ i dọ = in, i.e., Tia se em sentido anti-horário, 
Z — Lo T 


dz 9 
=i dp = —ir, i.e., — mia—ı seem sentido horário. 
Z — to T: 


Essa contribuição, + ou —, aparece no lado esquerdo da Equação (7.6). Se nosso desvio fosse em sentido horário, 
o resíduo não seria envolvido e não haveria nenhum termo correspondente do lado direito da Equação (7.6). 
Contudo, se nosso desvio fosse em sentido anti-horário, esse resíduo seria envolvido pelo contorno C e um 
termo 27ia.., apareceria no lado direito da Equação (7.6). 
O resultado líquido para desvio em sentido horário ou em sentido anti-horário é que um pólo simples sobre o 
contorno é contado como metade do que seria caso estivesse dentro do contorno. Isso corresponde a considerar o 
valor principal de Cauchy. Por exemplo, vamos supor que f(z) com um pólo simples em z = xo seja integrada 
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C e 


Figura 7.2: Contornando pontos singulares. 


sobre todo o eixo real. O contorno é fechado com um semicírculo infinito no semiplano superior (Figura 7.3). 


Então, 
froe- [ o rod | EOL 


oO 
+ T f(x)dx + J semicírculo infinito 
xo+ô C 


= 9ni 5 resíduos envolvidos. (7.16) 


Figura 7.3: Desviando de pontos singulares. 


Se o pequeno semicírculo C}, incluir xo (por passar por baixo do eixo x em sentido anti-horário), £o é envolvido 
e sua contribuição aparece duas vezes — como ria. em f Co, E COMO 2ria- 4 no termo 2mi >” de resíduos 
envolvidos — para uma contribuição líquida de mia. 4. Se o pequeno semicírculo superior for selecionado, £o 
é excluído. A única contribuição vem da integração em sentido horário sobre C,,, que resulta em —ria-1. 
Transferindo isso para a extrema direita da Equação (7.16), temos +ria 4, como antes. 

As integrais do eixo x podem ser combinadas e pode-se permitir que o raio do semicírculo se aproxime de zero. 


Portanto, definimos 5 
imf / ; f(x) d+ | f(x) dz) = Bi f(x) da. (7.17) 


350 — oo xo+ó 


P indica o valor principal de Cauchy e representa o processo de limite precedente. Note que o valor principal de 
Cauchy é um processo de equilíbrio (ou de cancelamento). Na vizinhança de nossa singularidade em z = 76, 


a 


f(x) = (7.18) 


r= zo 
Isso é ímpar em relação a xo. O intervalo simétrico ou par (em relação a xo) dá o cancelamento das áreas 
sombreadas, Figura 7.4. A contribuição da singularidade é na integração em torno do semicírculo. 

Em geral, se uma função f(x) tem uma singularidade xo em algum lugar dentro do intervalo a < zo < be é 
integrável sobre toda porção desse intervalo que não contenha o ponto xo, então definimos 


b xzo—ôı b 
/ f(x)dx = lim f(x)dx + lim F(a) dz, 


ó1>0 à 2—0 £o+ô2 
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Figura 7.4: Cancelamento de um pólo simples. 


quando o limite existe e, à; — 0 independentemente; caso contrário, diz-se que a integral diverge. Se esse limite 
não existir, mas o limite dj = 92 = ô — 0 existir, ele é definido como o valor principal da integral. 
Essa mesma técnica de limite é aplicável aos limites de integração +00. Definimos 


a>-—00,b—00 


J iou- lim f toa, (1.19a) 


se a integral existir com a, b aproximando-se de seus limites independentemente; caso contrário, a integral diverge. 
No caso de a integral divergir, mas 


a 


lim f(x)dx = pf f(x)dx (7.19b) 


a> J_ a 
existir, ele é definido como seu valor principal. 


Expansão de Pólo de Funções Meromórficas 
Funções analíticas f(z) que têm como singularidades somente pólos isolados são denominadas meromórficas. 
São exemplos cotg z [de + In sen z na equação (5.210)] e razões de polinômios. Por simplicidade, vamos admitir 
que esses pólos em z = a, com O < |a1| < |as| < --- sejam todos simples, com resíduos bn. Então, uma 
expansão de f(z) em termos de b,(z — an)” ! depende, de um modo sistemático, de todas as singularidades de 
f(z), em contraste com a expansão de Taylor em torno de um ponto analítico zo de f(z) arbitrariamente escolhido 
ou da expansão de Laurent em torno de um dos pontos singulares de f(z). 

Vamos considerar uma série de círculos concêntricos Cp em torno da origem, de modo que C» inclui 
01,42, ..., Gn Mas nenhum outro pólo, seu raio Rn — oo, à medida que n — oo. Para garantir convergência, 
admitimos que |f(z)| < €Rn para qualquer constante positiva pequena £ e todo z sobre C,,. Então, a série 


HO)=H0+5 baliza) + an} (7.20) 


converge para f(z). Para provar esse teorema (que se deve a Mittag-Leffler), usamos o teorema dos resíduos para 
avaliar a integral de contorno para z dentro de Cn: 


= + (7.21) 
a — 2) z 
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Sobre Cn temos, para n — œ, 


MáX on CG|f(w)| cR, 
Ll|<27R, z < 
[m| £ 27 nRa (Raiz) © Ra-l É 


para Rn > |z|. Usar I„ — 0 na Equação (7.21) prova a Equação (7.20). 
Se |f(z)| < eRP*!, então avaliamos de modo semelhante a integral 


1 Hu) à medi 
In = Dni J A dw — 0 à medida que n — œo 


e obtemos a expansão de pólo análoga 


br PO att 


,2 (œ) (0 
16) = 160) HO 4 ET 2 (129) 


Z— Gn 


Note que a convergência da série nas Equações (7.20) e (7.22) é subentendida pelo limite de |f(z)| para |z| — oo. 


Expansão de Produto de Funções Inteiras 
Uma função f(z) que é analítica para todo z finito é denominada função inteira. A derivada logarítmica f'/f é 
uma função meromórfica com uma expansão de pólo. 
Se f(z) tem um zero simples em z = an, então f(z) = (z — an)g(z) com g(z) analítica e g(an) Æ 0. Por 
conseguinte, a derivada logarítmica 
1 £ 


f(z) g(2) 
tem um pólo simples em z = a, com resíduo 1, g'/g é analítica nesse ponto. Se f'/f satisfaz as condições que 
levam à expansão do pólo na Equação (7.20), então 


É L4 5S ++ = — (7.24) 


n=1 


é válida. Integrando a Equação (7.24), temos 


Apa n f(z)—ln 
| FE e-me -mso 


e exponenciando obtemos a expansão de produto 


f(z) = O e| 2) II(: E E Jem, (7.25) 


São exemplos as expansões de produto (veja o Capítulo 5) para 


| ZINT | Ze 
meme TT (1-5 Je! =-TI( da): 
120 (1.26) 
oO 22 
ess Mt mom) 
n=1 


Um outro exemplo é a expansão de produto da função gama, que será discutida no Capítulo 8. 
Como conseqgiiência da Equação (7.23), a integral de contorno da derivada logarítmica pode ser usada para 
contar o número Ny de zeros (incluindo suas multiplicidades) da função f(z) dentro do contorno C: 


1 FFO 
2ri Jo f(z) 


dz = Ny. (7.27) 
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Além do mais, usando 
1 
/ Ee dz =ln f(z) = In| f(2)| +iarg f(z), (7.28) 
z 


vemos que a parte real na Equação (7.28) não muda à medida que z percorre o contorno uma vez, enquanto a 
variação correspondente, em arg f, deve ser 


Ac arg(f) = 27Np. (1.29) 


Isso leva ao teorema de Rouché: se f(z) e g(z) são analíticas dentro e sobre um contorno fechado C e 
Ig(2)] < | f(z)| sobre C, então f(z) e f(z) + g(z) têm o mesmo número de zeros dentro de C. 
Para mostrar isso, usamos 


27Ny+g = Acarg(f + 9) = Acarg(f) + Ac arg(1 + s), 
Uma vez que |g| < |f| sobre C, o ponto w = 1 + g(z)/f(z) é sempre um ponto interior do círculo no plano w 
com centro em 1 e raio 1. Por conseqiiência, arg(1 + g/f) deve voltar a seu valor original quando z percorrer 
o contorno C (não circunda a origem); ele não pode decrescer ou crescer por um múltiplo de 27, de modo que 
Acarg(l +g/f) =0. 

O teorema de Rouché pode ser usado para uma prova alternativa do teorema fundamental da álgebra: um 
polinômio 37 o 4m2” com an £ 0 tem n zeros. Definimos f(z) = anz”. Então f tem um zero de multiplicidade 
n na origem e nenhum outro zero. Seja g(z) = Jr E AmZ”. Aplicamos o teorema de Rouché a um círculo C 
com centro na origem e raio R > 1. Sobre C,|f(2)| = |an| R” e 


n—1 
lg(9)| < laol + lm|R+ +++ + lan |RºT! < (> onl) 


m=0 


Daí, |g(z)| < |f(z)| para z sobre C, contanto que R > E lam|)/|an|. Portanto, para todos os círculos C 


suficientemente grandes, f + g = o amz” tem n zeros dentro de C de acordo com o teorema de Rouché. 


Avaliação de Integrais Definidas 

Integrais definidas aparecem repetidas vezes em problemas de física matemática, bem como em matemática pura. 
Há três técnicas moderadamente gerais que são úteis para avaliar integrais definidas: (1) integração de contorno, 
(2) conversão para funções gama ou beta (Capítulo 8) e (3) quadratura numérica. Entre outras abordagens 
estão a expansão de série com integração termo a termo e transformadas integrais. Como veremos na segiiência, o 
método de integração de contorno é talvez o mais versátil desses métodos, uma vez que é aplicável a uma ampla 
variedade de integrais. 


. . 2 
Integrais Definidas: [,” f(sen 0, cos 0) d0 
O cálculo de resíduos é útil na avaliação de uma ampla variedade de integrais definidas em problemas de física, 
bem como em problemas puramente matemáticos. Consideramos, em primeiro lugar, integrais da forma 
2T 
p= f(sen 0, cos 0) do, (7.30) 
0 

em que f é finita para todos os valores de 6. Também exigimos que f seja uma função racional de sen 0 e cos 0, 
de modo que será uma função de valor único. Seja 


z=, dz = ie? do. 
Por essa expressão, 
d "a -1 
dp se sen 6 = E. cos 0 = RRR (7.31) 
z 2i 2 
Nossa integral se torna 
“91 —1 d 
i= ps de A ATA E (7.32) 
2i 2 2 


sendo o caminho de integração o círculo unitário. Pelo teorema dos resíduos, Equação (7.16), 
I = (—i)2ri 5 resíduos de um círculo unitário. (7.33) 


Note que estamos atrás dos resíduos de f/z. Os Exercícios 7.1.7 a 7.1.10 ilustram integrais desse tipo. 
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Exemplo 7.1.2 INTEGRAL DE COS NO DENOMINADOR 
Nosso problema é avaliar a integral definida 
27 
d0 
I= I ——, lej <1. 
o l+ecosð 
Pela Equação (7.32) essa expressão se torna 
; f dz 
I= -—i = 
círculo unitário Z[L + (€/2)(2 + 27!)] 
.2 f dz 
c= A . 
e J 2+ (2/e)z+1 
O denominador tem raízes 
1 1 1 1 
z- =——— —V1—€2 e = +>vV1-—e2, 
E E E € 
em que z4 está dentro do círculo unitário e z. está fora. Então, pela Equação (7.33) e o Exercício 6.6.1, 
2 1 
I=-i—-2mi à 
E 2z + 2/e z=—1/e+(1/e)VI—e? 
Obtemos 
“do 27 
= ; lel <1. 
o 1I+ecos6 4/1 — £2 
E 
. ~ . . oo 
Avaliação de Integrais Definidas: [™_ f(x) dx 
Suponha que nossa integral definida tenha a forma 
[= / Fla) de (7.34) 


e satisfaça as duas condições: 


e f(z) é analítica no semiplano superior, exceto para um número finito de pólos. (Admitiremos que não há nenhum 
pólo no eixo real. Se houver pólos presentes no plano real, eles podem ser incluídos ou excluídos como já 


discutimos antes nesta seção.) 
e f(z) desaparece tão fortemente ? quanto 1/22 para |z| — 00, 0 <argz< m. 


Com essas condições, podemos considerar como um contorno de integração o eixo real e um semicírculo no 
semiplano superior, como mostra a Figura 7.5. Deixamos que o raio R do semicírculo se torne infinitamente grande. 


Então, 


Figura 7.5: Contorno de semicírculo. 


2Poderíamos usar f(z), que se anula mais rapidamente do que 1/z, e gostaríamos que f(z) fosse de valor único. 
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R T 
f f(z)dz= lim i f(x) de + lim r f(ReNiRe do 
R>o J p R-o00 Jo 
= 2ri >, resíduos (semiplano superior). (7.35) 


Pela segunda condição, a segunda integral (sobre o semicírculo) desaparece e 
/ f(x)dx = 2mi Xo resíduos (semiplano superior). (7.36) 


Exemplo 7.1.3 INTEGRAL DE FUNÇÃO MEROMÓRFICA 


Avalie G 
£ 

{= ; 7.37 

E 037 


Pela Equação (7.36), 


o cd 
n N Gê o = 271% 5 resíduos (semiplano superior). 


Aqui, e em outros problemas semelhantes, surge a pergunta: em que estão os pólos? Reescrevendo o integrando 
como 


Ed 1 (1.38) 
2+1 z+i 2-4" É 
vemos que há pólos simples (ordem 1) em z = ie z = —i. 
Um pólo simples em z = zo indica (e é indicado por) uma expansão de Laurent da forma 
as ad 
= n(z — 29)”. 7.39 
fz) ed O zo) (7.39) 
O resíduo a. é facilmente isolado como (Exercício 6.6.1) 
a = (z — z0) f (2)lz=z0: (1.40) 
Usando a Equação (7.40), constatamos que o resíduo em z = 1 é 1/2i, ao passo que em z = —iis —1/2i. 
Então, 
eo dE 1 
— Do =mi: — =r. 7.41 
a dia Ra (D 


Aqui usamos a—;ı = 1/2i para o resíduo do único pólo incluído em z = i. Note que é possível usar o semicírculo 
inferior e que essa escolha levará ao mesmo resultado, I = 7. Um problema um pouco mais delicado é dado pelo 
exemplo seguinte. E 


Avaliação de Integrais Definidas: [2 f(x)e'” da 
Considere a integral definida 


I= EM f(a) de, (7.42) 


com a real e positivo. (Essa é a transformada de Fourier, Capítulo 15.) Admitimos as duas condições: 
e f(z) é analítica no semiplano superior, exceto para um número finito de pólos. 


° a i f(z2) =, 0O<argz<r. (7.43) 


. w 2 wè em . . OO 
Note que essa condição é menos restritiva do que a segunda condição imposta a f(z) para integrar f% f(x)dx 
previamente. 
Empregamos o contorno mostrado na Figura 7.5. A aplicação do cálculo de resíduos é a mesma que a aplicação 
que acabamos de considerar, mas temos de trabalhar mais para mostrar que a integral sobre o semicírculo (infinito) 
vai a zero. Essa integral se torna 


Ir = J J(Re et cos 0—aRSENz0; Ret? do. (7.44) 
0 


Seja R tão grande que |f(2)| = | f(Re'?)| < £. Então, 


T n/2 
|IrR| <ER i E PSP qo. = 2ER / Eid, (7.45) 
0 0 
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Na faixa [0, 7/2], 
2 
—0 < sen 6. 
T 


Portanto (Figura 7.6), 


> 


(a) 


ja 


Figura 7.6: (a) y = (2/7)0, (b) y = sen 6. 


n/2 
|Ir| < 2ER / ECON qo, (7.46) 
0 
Agora, integrando por inspeção, obtemos 
{= ETR 
Irg| < 2eR-——. 
Hal < 2e 2aR/n 
Por fim, 
T 
lim |Ir| < —e. (1.47) 
R—o0 a 
Pela Equação (7.43), € — 0 quando R > œ e 
dim |Ir| = 0. (7.48) 


Esse útil resultado às vezes é denominado lema de Jordan. Com ele, estamos preparados para atacar as integrais 
de Fourier da forma mostrada na Equação (7.42). 
Usando o contorno mostrado na Figura 7.5, temos 


L é f(x) dx + dim Ir = 2mi 5 resíduos (semiplano superior). 
Uma vez que a integral sobre o semicírculo superior Ip se anula à medida que R — co (lema de Jordan), 

/ o f(x) dae = 2ri 5 resíduos (semiplano superior) (a > 0). (7.49) 
Exemplo 7.1.4 PÓLO SIMPLES SOBRE CONTORNO DE INTEGRAÇÃO 


O problema é avaliar 
Ta / Sen T qg. (1.50) 
0 


x 


Essa expressão pode ser considerada como a parte imaginária? de 


[e.e] izd 
n=P | e (1.51) 


Z 
Agora o único pólo é um pólo simples em z = 0 e o resíduo nesse ponto é a 4 = 1, pela Equação (7.40). 
Escolhemos o contorno mostrado na Figura 7.7 (1) para evitar o pólo, (2) para incluir o eixo real e (3) para resultar 


Podemos usar Jl(e'z — e-'2)/2iz] dz, mas então serão necessários dois contornos diferentes para as duas exponenciais (compare com o 
Exemplo 7.1.5). 
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um integrando pequeno, que tende a desaparecer, para z = iy,y — œ. Note que, nesse caso, um semicírculo 
grande (infinito) na parte inferior do semiplano seria desastroso. Temos 


iz TR 4d iz R iz d izd 
f a) a) E zaf E “+ E tn, (7.52) 
A -R T Gi A r a: Cs VA 


sendo que o zero final vem do teorema dos resíduos (Equação (7.6)). Pelo lema de Jordan, 


f Sea (1.53) 
Co Z 
z d 12 d oo x d. 
f t= [ Š tar] E sr (7.54) 
z Fo AE 


A integral sobre o semicírculo pequeno resulta em (—)i vezes o resíduo de 1, e menos, como resultado da 
trajetória em sentido horário. Tomando a parte imaginária? 


temos as 
i POR A (7.55) 
lo Si 
ou a 
f EC (7.56) 
0 z£ 2 


O contorno da Figura 7.7, embora conveniente, não é, de modo algum, único. Uma outra opção de contorno 
para avaliar a Equação (7.50) é apresentada no Exercício 7.1.15. 


Exemplo 7.1.5 EsPALHAMANTO NA MECÂNICA QUÂNTICA 
A análise do espalhamento na mecânica quântica leva à função 


“ rsen zdr 
Io) = a ai (7.57) 


em que o é real e positivo. Essa integral é divergente e, portanto, ambígua. Pelas condições físicas do problema, 
há ainda mais um requisito: (o) deve ter a forma e'”, de modo que representará uma onda espalhada emergente. 
Usando 


1 l1; l 
sen z = -senh iz = —e” — —e “, (7.58) 
) 2i 2i 
escrevemos a Equação (7.57) no plano complexo como 
Io)=h+ 6, (7.59) 


4 Alternativamente, podemos combinar as integrais da Equação (7.52) como 


[ee] ne - [ (8 iz) dx =a f" sent. 
-R K T T r x e x£ 
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Figura 7.8: Contornos. 


com 
1 FS ze” 
Tara aE 
t 2J 2- o? e 
1/9 ze 
I = dz. 7.60 
j 2i D 2o (oD) 


A integral 1 é semelhante ao Exemplo 7.1.4 e, como naquele caso, podemos completar o contorno por um 
semicírculo infinito no semiplano superior, como mostra a Figura 7.8a. Para 15, a exponencial é negativa, e 
completamos o contorno por um semicírculo infinito no semiplano inferior, como mostra a Figura 7.8b. Assim 
como no Exemplo 7.1.4, nenhum dos semicírculos contribui com qualquer coisa para a integral — lema de Jordan. 

Há ainda o problema de localizar os pólos e avaliar os resíduos. Encontramos pólos em z = to ez = —0 
sobre o contorno de integração. Os resíduos são (Exercícios 6.6.1 e 7.1.1) 


2=0 Z=— —O 
i eis emo 
1|— 
2 2 
Tio eis 
hbk — > 
2 2 


Desviando ao redor dos pólos, como mostra a Figura 7.8 (pouco importa se formos por cima ou por baixo), 
constatamos que o teorema dos resíduos leva a 


1 ET to 1 etr 1 etr 
PI ) ) = 2mi| — |-— 7.61 
l ni(x) 2 +mi(5:) 2 nix) 2 SR 
porque envolvemos a singularidade em z = o mas excluímos a singularidade em z = —o. De modo semelhante, 
mas notando que o contorno para I> é em sentido horário, 
—1N eis —1N et —1N eis 
PI: ) ) = —2ri à 7.62 
E a(z) +l) 2 a(S (102) 


Somando as Equações (7.61) e (7.62), temos 
PI(o) = Ph+ Pb = ate” +e'º) = r cosh io = T coso. (1.63) 


Essa é uma avaliação perfeitamente boa da Equação (7.57), mas, infelizmente, a dependência do co-seno é 
adequada para uma onda estacionária e não para a onda espalhada emergente, como especificamos. 

Para obter a forma desejada, experimentamos uma técnica diferente (compare com o Exemplo 7.1.1). Em 
vez de nos esquivarmos ao redor dos pontos singulares, vamos removê-los do eixo real. Especificamente, seja 
o — o + iy, —0o > —o — iy, em que y é positivo mas pequeno e eventualmente será obrigado a se aproximar de 
zero; isto é, para 14 incluímos um dos pólos e para I> incluímos o outro, 


Lilo) = am I(o + iy). (7.64) 
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Com essa simples substituição, a integral de primeira ordem 1, se torna 


Í , ia 1N élt) 
a(o +iy) = ni(>) 7 


(7.65) 


por aplicação direta do teorema dos resíduos. Além disso, 


—1 \ elo+iy) 
) £ (1.66) 


hlo +iy)= ari zi 3 
Somando as Equações (7.65) e (7.66), e então deixando y — 0, obtemos 
Li(o) = lim [f(o +iy) + Io(0 + i9)] 
EO Ad 


= lim Téti) = ret, (7.67) 


y>0 
um resultado que realmente se ajusta às condições de fronteira de nosso problema de espalhamento. 
E interessante notar que a substituição o — o — iy teria levado a 


Iloj=1e", (7.68) 


que poderia representar uma onda incidente. Vemos que nosso resultado anterior (Equação (7.63)) é a média 
aritmética das Equações (7.67) e (7.68). Essa média é o valor principal de Cauchy da integral. Note que temos 
essas possibilidades (Equações (7.63), (7.67) e (7.68)) porque nossa integral não é definida unicamente, até que 
especifigquemos o processo particular de limite (ou média) a ser usado. 


Avaliação de Integrais Definidas: Formas Exponenciais 

Quando há funções exponenciais ou hiperbólicas presentes no integrando, a vida fica um pouco mais complicada 

do que antes. Em vez de uma prescrição geral global, o contorno deve ser escolhido para se ajustar à integral 

específica. Esses casos são também oportunidades para ilustrar a versatilidade e o poder da integração de contorno. 
Como exemplo, consideramos uma integral que será bastante útil no desenvolvimento de uma relação entre 

T(1 + 2) eT(1 — 2). Note como é explorada a periodicidade ao longo do eixo imaginário. 


Exemplo 7.1.6 Função FATORIAL 
Queremos avaliar 


[e0] err 
= d I; 7. 
Lire GA O<a< (7.69) 


Os limites impostos a a são suficientes (mas não necessários) para evitar que a integral divirja, à medida que 
x — +oo. Essa integral (Equação 7.69) pode ser manipulada substituindo a variável real x pela variável complexa 
z e integrando ao redor do contorno mostrado na Figura 7.9. Se tomarmos o limite, à medida que R — co, o eixo 
real, é claro, leva à integral que queremos. O caminho de retorno ao longo de y = 27 é escolhido para deixar 
invariante o denominador da integral, introduzindo, ao mesmo tempo, um fator constante e'27a no numerador. 
Temos, no plano complexo, 


az R ax R ax 
f C dz= lim l dr- a dr 
1 +e? R>œ\J- -rl +e -pl+e” 


2 (1 o eira) EE 


7.7 
TT an 


Além disso, há duas seções verticais (0 < y < 27), que desaparecem (exponencialmente), à medida que 
R> œ. 
Agora, onde estão os pólos e quais são os resíduos? Temos um pólo quando 


e = ee = —]. (7.71) 


A Equação (7.7) é satisfeita em z = 0 + ir. Por uma expansão de Laurent? em potências de (z — ir) verificamos, 
que o pólo é um pólo simples com um resíduo de —e'”º. Então, aplicando o teorema dos resíduos, 


(1 — era) / Ro -dg = 2mi(—eº). (7.72) 
ms e 


f, . . - AD 
S1 +e? = 1H eTe = 1 et m (e in) (l + Ep E pe), 
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-R + 21i R+ 21i 


Figura 7.9: Contorno retangular. 


Essa expressão se reduz rapidamente a 


/ dp 0<a<l. (1.13) 


x b) 
-ovl+e sen am 


Usando a função beta (Seção 8.4), podemos mostrar que a integral é igual ao produto T (a)T (1 — a). Isso resulta 
na interessante e útil relação da função fatorial 


TA 


T(a+1)P(1— a) = (1.74) 


senta 
Embora a Equação (77.73) seja válida para a real, a,0 < a < 1,a Equação (7.74) pode ser estendida por continuação 
analítica para todos os valores de a, reais e complexos, excluindo apenas valores inteiros reais. E 


Como exemplo final de integrais de contorno de funções exponenciais, consideramos, mais uma vez, os números 
de Bernoulli. 


Exemplo 7.1.7 Números DE BERNOULLI 
Na Seção 5.9, os números de Bernoulli foram definidos pela expansão 


oo B, 
É > gr. (7.75) 
Substituindo x por z (continuação analítica), temos uma série de Taylor (compare com a Equação (6.47)) com 


l 
pra n! f z dz (176) 


2ri Jo, € = get 


em que o contorno Co é ao redor da origem em sentido anti-horário com |z| < 27 para evitar os pólos em 2rin. 
Para n = 0, temos um pólo simples em z = 0 com um resíduo de +1. Daí, pela Equação (7.25), 


Bo = — - 2mi(1) = 1. (7.17) 
Para n = 1, a singularidade em z = 0 se torna um pólo de segunda ordem. Podemos mostrar que o resíduo é -4 
por expansão de série da exponencial, seguida por uma expansão binomial. Isso resulta em 


B= Ma 2mi(-3) ETEA (7.78) 


Paran > 2 esse procedimento de torna bastante tedioso, e recorremos a um meio diferente para avaliar a 
Equação (7.76). O contorno é deformado, como mostra a Figura 7.10. 

O novo contorno € ainda circunda a origem, como requerido, mas agora também circunda (em uma direção 
negativa) uma série infinita de pontos singulares ao longo do eixo imaginário em z = tp2mi,p = 1,2,3,... A 
integração para a frente e para trás ao longo do eixo x se cancela e, para R — co, a integração sobre o círculo 
infinito resulta em zero. Lembre-se de que n > 2. Portanto, 


d oo 
$ Z S =mi resíduos (z = +p2ri). (7.79) 
C 


e? — 1 zn+1 
0 p=1 
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Figura 7.10: Contorno de integração para números de Bernoulli. 


Em z = p2ri, temos um pólo simples com um resíduo (p27:)””. Quando n é ímpar, o resíduo de z = p2ri 
cancela exatamente o resíduo de z = —p2rie B, = 0,n = 3,5, 7, e assim por diante. Para n par, os resíduos se 
somam, dando 


y 


—2ri)2 PO sq nmi? 


em 1)"/29n! 


= “Cr A p”= r= sta) (n par), (7.80) 


em que C(n) é a função zeta de Riemann apresentada na Seção 5.9. A Equação (7.80) corresponde à 
Equação (5.152) da Seção 5.9. 


Exercícios 
7.1.1 Determine a natureza das singularidades de cada uma das seguintes funções e avalie os resíduos 
(a > 0). 
(à) o 
a) =. 
z2? +a? (22 +a?) 
A sen 1/z 
—. d ; 
O rap d Sa 
zeti? zeti? 
(e) 22 Es a2 + (1) 22 = a2 E 
+iz —k 
e z 
S——. h) —, 0<k<l1. 
(a i 


Sugestão: Para o ponto no infinito, use a transformação w = 1/z para |z| — 0. Para o resíduo, 
transforme f(z) dz para g(w) dw e observe o comportamento de g(w). 


7.1.2 Localize as singularidades e avalie os resíduos de cada uma das seguintes funções: 


(a) z(e —- 1), z #0, 


Ze” 


1+ e? 

(c) Ache uma expressão de forma fechada (isto é, que não seja uma soma) para a soma das 
singularidades do plano finito. 

(d) Usando o resultado da parte (c), qual é o resíduo em |z| — o0? 


(b) 


Sugestão: Veja a Seção 5.9 para expressões que envolvem números de Bernoulli. Note que a 
Equação (5.144) não pode ser usada para investigar a singularidade em z — oo, uma vez que 
essa série só é válida para |z| < 27. 
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7.1.3 A afirmação de que a integral de meia-volta ao redor de um ponto singular é igual à metade da 
integral de volta inteira estava limitada a pólos simples. Mostre, por um exemplo específico, que 
1 
Hode=> He) de 
Semicírculo 2 JCírculo 
não vale necessariamente se a integral circundar um pólo de ordem mais alta. 
Sugestão: Experimente f(z) = 272. 
7.1.4 A função f(z) é analítica ao longo do eixo real, exceto para um pólo de terceira ordem em z = xo. 
A expansão de Laurent em torno de z = xo tem a forma 
as a 
f(z) = 3 +g(2), 
(z — xo) z — £o 
com g(z) analítica em z = £o. Mostre que a técnica do valor principal de Cauchy é aplicável no 
sentido de que 
x£zo—ô oo 
(a) imf / f(x)dx + I f(x) dz) é finito. 
350 —oo xo+ô 
(b) f(z) dz = tira, 
Coy 
em que Cv, denota um semicírculo pequeno em torno de z = xo. 
7.1.5 A função degrau unitária é definida como (compare com o Exercício 1.15.13) 
0, s<a 
u(s— a) = 
1, s>a. 
Mostre que u(s) tem as representações integrais 
[9,0] ets 
= lim — dz, 
(aata) ar 21i Jo T— LE pó 
1 1 oO ixs 
(b) u(s) == + mº € dr 
2 Bmt Joss T 
Nota: O parâmetro s é real. 
7.1.6 A maioria das funções especiais da física matemática pode ser gerada (definida) por uma função 


geradora da forma 


glt, 2) =D flor. 


Dadas as seguintes representações integrais, derive as funções geradoras correspondentes: 
(a) Bessel: 
EE f eiae AR 


271 
(b) Bessel modificada: 


1 
Lilo) = — (2/04/80) pon 1 dt. 
(20) = 5m fe 
(c) Legendre: 
1 2 —1/2 —n—1 
P2) = 5 (1—-2tr +t’) t dt. 
mi 


(d) Hermite: 
l 
Ha(a) = Se. perap dt. 


y 1 e™zt/0—t) F 
n = A t. 
(a) 2mi f (1 — t)tr+ 


(e) Laguerre: 


ELSEVIER 
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7.1.10 


7.1.11 


7.1.12 


7.1.13 


7.1.14 


7.1.15 


(£) Chebyshev: 


1 (1 — tjt e1 
Tay dt 
(2) ma É IT 


Cada um dos contornos circunda a origem e nenhum outro ponto singular. 


Generalizando o Exemplo 7.1.2, mostre que 


ie do a do 2 NE 
o atbcos0 Jọ absen (a? -b2)1/2º apa 


O que acontece se |b| > |a|? 


Mostre que 


A do ma = 
o (a+cos0)2 a 7 


Eu do 27 
= para |t| < 1. 
0 


Mostre que 


1— 2tcos0 +t 1- 
O que acontece se |t| > 1? O que acontece se |t| = 1? 


Com o cálculo de resíduos, mostre que 


T on o (2n! — (2n-1)!! N 
f cos MO aa O Ent n=0,1,2,.... 


(A notação de fatorial duplo é definida na Seção 8.1.) 
Sugestão: cos ð = 4(e? +e = (z+ 27t), kz] =1. 
Avalie 

m cos bx — cos ax 


2 dz, a>b>o0. 


vo x 


Resposta: m(a — b). 


Prove que 


2 


Sugestão: sen?x = 1(1 — cos 2x). 


O cálculo da mecânica quântica de uma probabilidade de transição leva à função f(t,w) = 
2(1 — cos wt) /w?. Mostre que 


d ft, v)dw = 27t. 
Mostre que (a > 0) 
cosg Taca 
(a) A O = Teme, 


Como o lado direito será modificado se cos x for substituído por cos kx? 


zsenT y e 
of TE de= mer. 


Como o lado direito será modificado se sen x for substituído por sen kx? 


Essas integrais também podem ser interpretadas como transformadas de Fourier de co-seno e seno, 
Capítulo 15. 


Use o contorno mostrado (Figura 7.11) com R — oo para provar que 


(6.6) 
sen x 
J dz = T. 
Ioa x 
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Figura 7.11: Contorno quadrado grande. 
7.1.16 Na teoria quântica de colisões atômicas encontramos a integral 
© sent ; 
T= f DD e dt, 
Edo DÊ 


na qual p é real. Mostre que 
I=0, Ipj>1 
I=7, Ip) <1. 


oo 2 
f (In x) Em 
0 1 + x2 


(a) por adequada expansão de série da integranda para obter 


O que acontece se p = +1? 
7.1.17 Avalie 


ASI) (en + ir 
n=0 


(b) e por integração de contorno para obter 
3 
T 
g . 


Sugestão: x — z = e*. Experimente o contorno mostrado na Figura 7.12, deixando R — œ. 


Figura 7.12: Contorno quadrado pequeno. 


7.1.18 — Mostre que 


e qo Ta 
dx = ; 
o (x+1) sen ma 


em que —1 < a < 1. Eis aqui mais outro modo de derivar a Equação (7.74). 

Sugestão: Use o contorno mostrado na Figura 7.13, observando que z = 0 é um ponto de 
ramificação e o eixo x positivo é uma linha de corte. Note também os comentários sobre fases 
logo após o Exemplo 6.6.1. 


7.1.19 Mostre que 


ELSEVIER 
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7.1.20 


7.1.21 


7.1.22 


7.1.23 


Figura 7.13: Contorno que evita ponto de ramificação e pólo. 


em que O < a < 1. Isso abre outro modo de derivar a relação de função fatorial dada pela 
Equação (7.74). 
Sugestão: Você tem um ponto de ramificação e precisará de uma linha de corte. Lembre-se de que 
z271 = w em forma polar é 

[re 4+2mn)] soaa pe’, 
o que leva a —ad — 2anr = y. Você deve restringir n a zero (ou a qualquer outro inteiro único), de 
modo que « possa ser unicamente especificado. Experimente o contorno mostrado na Figura 7.14. 


y 


Figura 7.14: Contorno alternativo que evita ponto de ramificação. 


Mostre que 
/ S, dz T S 
= a 
o (z?+a?)2  4a3’ 
Avalie 
a 
“o l+ rt 
Resposta: n/V'2. 

Mostre que 


J: cos(t°) dt = o sen (t°) dt = = 


Sugestão: Experimente o contorno mostrado na Figura 7.15. 

Nota: Essas são as integrais de Fresnel para o caso especial de infinito como limite superior. Para 
o caso geral de um limite superior variável, expansões assintóticas das integrais de Fresnel são o 
tópico do Exercício 5.10.2. Expansões esféricas de Bessel são o tópico do Exercício 11.7.13. 


Diversas das integrais de Bromwich, Seção 15.12, envolvem uma porção que pode ser aproximada 


por 
a+iy et 
ra= f -17297 


364 
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7.1.24 


7.1.25 


7.1.26 


7.1.27 


>c 


n/4 


Figura 7.15: Contorno angular. 


Aqui, a e t são positivos e finitos. Mostre que 


lim T(y) = 0. 


Y—00 


T pod aa 
o l+” sen(7/n) 


Sugestão: Experimente o contorno mostrado na Figura 7.16. 


Mostre que 


(a) Mostre que 
f(z) = 24 — 2 cos 202? + 1 
tem zeros em efe? —et?, e —e'*, 
(b) Mostre que 


O Exercício 7.1.24 (n = 4) é um caso especial desse resultado. 


Mostre que 


a dx a Ti T 
o Tt — 2 cos 20r? +1  2sen0  21/2(1 — cos 20)!/2' 


O Exercício 7.1.21 é um caso especial desse resultado. 


Aplique as técnicas do Exemplo 7.1.5 à avaliação da integral imprópria 


e de 
e a 


>< 


R>% 


Figura 7.16: Contorno de setor. 


o x? dz ea da T 
o Xt — 2 cos 20x2? +1  2sen0  21/2(1 — cos20)1/2' 
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(a) Seja o > o + iy. 
(b) Seja o > o — iy. 
(c) Considere o valor principal de Cauchy. 


7.1.28 A integral no Exercício 7.1.17 pode ser transformada em 


oo 2 3 
J eY dy = L 
0 1+e-2y 16 


Avalie essa integral pela quadratura de Gauss-Laguerre e compare seu resultado com 7º /16. 
Resposta: Integral = 1,93775 (10 pontos). 


7.2 Relações de Dispersão 


O conceito de relações de dispersão entrou na física com o trabalho de Kronig e Kramers na óptica. O nome 
dispersão vem de dispersão óptica, um resultado da dependência entre o índice de refração e o comprimento 
de onda ou frequência angular. O índice de refração n pode ter uma parte real determinada pela velocidade de 
fase e uma parte imaginária (negativa) determinada pela absorção, veja a Equação (7.94). Em 1926-1927, Kronig 
e Kramers mostraram que a parte real de (n? — 1) podia ser expressa como uma integral da parte imaginária. 
Generalizando isso, aplicaremos o rótulo relações de dispersão a qualquer par de equações que dêem a parte real 
de uma função como uma integral de sua parte imaginária e a parte imaginária como uma integral de sua parte real, 
Equações (7.86a) e (7.86b), que vêm a seguir. Poderíamos ter suspeitado da existência de tais relações integrais 
como uma integral análoga das relações diferenciais de Cauchy-Riemann, Seção 6.2. 

As aplicações na física moderna são bem difundidas. Por exemplo, a parte real da função poderia descrever 
o espalhamento frontal de um raio gama em um campo nuclear de Coulomb (um processo dispersivo). Então, a 
parte imaginária descreveria a produção do par elétron-pósitron naquele mesmo campo de Coulomb (o processo 
de absorção). Como veremos mais adiante, as relações de dispersão podem ser consideradas uma consegiiência da 
causalidade e, portanto, são independentes dos detalhes da interação particular. 

Consideramos uma função complexa f(z) que é analítica no semiplano superior e no eixo real. Também 
exigimos que 

lim |f(2)|=0, 0<argz <r, (7.81) 
Iz|=00 

para que a integral sobre um semicírculo infinito se anule. A questão dessas condições é que podemos expressar 
f(z) pela fórmula integral de Cauchy, Equação (6.43), 


1 
Fas BOFA (1.82) 
2mi J z— zo 
A integral sobre o semicírculo superior” desaparece, e temos 
1 oO 
Flo) = — / RLE (7.83) 
2mi J o X— 20 
A integral sobre o contorno mostrado na Figura 7.17 tornou-se uma integral ao longo do eixo x. 
y 4 
R S —oo f R> Es À 


Figura 7.17: Contorno de semicírculo. 


A Equação (7.83) admite que zo está no semiplano superior — interior ao contorno fechado. Se zo estivesse no 
semiplano inferior, a integral resultaria em zero pelo teorema integral de Cauchy, Seção 6.3. Agora, quer deixando 


6O uso de um semicírculo para fechar o caminho de integração é conveniente, mas não obrigatório. Outros caminhos são possíveis. 


“livro” — 2007/8/1 — 15:06 — page 366 — #376 


366 Física Matemática Arfken e Weber ELSEVIER 


que zo se aproxime do eixo real por cima (zo — zo), quer colocando-o sobre o eixo real e considerando uma média 
entre a Equação (7.83) e zero, constatamos que a Equação (7.83) se torna 


f(xo) = zef Pe q, (7.84) 


Ti Joov— To 


em que P indica o valor principal de Cauchy. Subdividindo a Equação (7.84) em partes real e imaginária”, obtemos 
f(zo) = ulxo) + iv(xo) 
1 v(x) i © u(x) 
= -P dx P dz. (7.85) 
T — To 


oO 
EEEE T aa a i 


Por fim, igualando parte real com parte real e parte imaginária com parte imaginária, obtemos 


u(zo) = ef A qo (7.864) 


T. -œ L— To 
-1p f UD qr (7.86) 
T Jouv—xo 


v(zo) 


Essas são as relações de dispersão. A parte real de nossa função complexa é expressa como uma integral sobre a 
parte imaginária. A parte imaginária é expressa como uma integral sobre a parte real. As partes real e imaginária 
são as transformadas de Hilbert uma da outra. Note que essas relações são significativas somente quando f(x) é 
uma função complexa da variável real x. Compare com o Exercício 7.2.1. 

De um ponto de vista físico, u(x) e/ou v(x) representam algumas medições físicas. Então, f(z) = u(z) + iv(z) 
é uma continuação analítica sobre o semiplano superior, sendo que o valor sobre o eixo real serve como uma 
condição de fronteira. 


Relações de Simetria 
Ocasionalmente, f(x) satisfará uma relação de simetria e a integral de —oo para +oo pode ser substituída 
por uma integral sobre valores positivos apenas. Isso é de considerável importância física porque a variável x 
poderia representar uma frequência, e somente frequências zero e positivas estão disponíveis para medições físicas. 
Suponha? 
f(—x) = f* (x). (1.87) 

Então, 

u(—x) + iv(—x) = u(x) — iv(x). (7.88) 
A parte real de f(x) é par e a parte imaginária é ímpar.? Em problemas de dispersão da mecânica quântica, 
essas relações (Equação (7.88)) são denominadas condições de cruzamento. Para explorar essas condições de 
cruzamento, reescrevemos a Equação (7.86a) como 


0 oo 
uara irf SO qui pf i (7.89) 
T m Jọ £— To 


œ X — To 


Deixando que x — —x na integral de primeira ordem do lado direito da Equação (7.89) e substituindo 
v(—x) = —v(x) da Equação (7.88), obtemos 


1 po 1 1 
=>P d 
u(xo) E T Te Er = T 
2 [e0] 


= =P [ Edom (7.90) 
VN 0 H Piate ma To 
De modo semelhante, 
2 © zoufr) 
v(zo) = -P [ Pa da. (7.91) 


As relações de dispersão óptica originais de Kronig-Kramers eram dessa forma. O comportamento assintótico 
(xo — 00) das Equações (7.90) e (7.91) levam às regras da soma, da mecânica quântica, Exercício 7.2.4. 


17O segundo argumento, y = 0, é descartado: u(xo, 0) — u(xo). 

$Isso não é apenas uma feliz coincidência. Ela garante que a transformada de Fourier de f(x) será real. Por sua vez, a Equação (7.87) é 
uma conseqiiência da obtenção de f(x) como transformada de Fourier de uma função real. 

“u(x,0) = u(—2,0),v(x,0) = —v(—zx, 0). Compare essas condições de simetria com as que resultam do princípio da reflexão de 
Schwarz, Seção 6.5. 
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Dispersão Optica 

A função exp[i(ka — wt)]| descreve uma onda eletromagnética se movimentando ao longo do eixo x na direção 
positiva com velocidade v = w/k; w é a fregiiência angular, k o número de onda ou vetor de propagação e 
n = ck/w é o índice de refração. Pelas equações de Maxwell, permissividade elétrica £, e lei de Ohm com 
condutividade o, o vetor de propagação k para um dielétrico se torna! 


2 4 
P= et (1 +i =) (1.92) 
C WE 


(com u, a permeabilidade magnética considerada como unidade). A presença da condutividade (o que significa 
absorção) dá origem a uma parte imaginária. O vetor de propagação k (e portanto o índice de refração n) tornou-se 
complexo. Ao contrário, a parte imaginária (positiva) implica absorção. Para má condutividade (470 /we < 1) 


uma expansão binomial resulta em 
210 


Ww 
E eE aah 
Ver ii VE 
e (bx—wt) e Peg va E Ao a did de A 


uma onda atenuada. 
Voltando à expressão geral para k2, Equação (7.92), constatamos que o índice de refração se torna 


o 4 
=D ei T, (7.93) 
(02 W 


Consideramos que n? é uma função da variável complexa w (com £ e o dependendo de w). Contudo, n? não 


desaparece quando w — oo, mas, em vez disso, se aproxima da unidade. Assim, para satisfazer a condição, 
Equação (7.81), trabalhamos com f (w) = n? (w) — 1. As relações de dispersão óptica originais de Kronig-Kramers 
eram dadas na forma de 


R[n?(wo) 1] = p [o S dw, 


T w? — wg 
2 ® woRin?(w)-— 1] Li 
af. 2 < Wo no 
3[n2(wo) — 1] = ePf E dw. 


Conhecer o coeficiente de absorção em todas as freqüências especifica a parte real do índice de refração e vice- 
versa. 


A relação de Parseval 
Quando as funções u(x) e v(x) são transformadas de Hilbert uma da outra (dadas pelas Equações (7.86)) e cada 
uma é integrável ao quadrado,!! as duas funções são relacionadas por 


e lu(x)|? de = T lu(æ)|? dz. (1.95) 


Essa é a relação de Parseval. 
Para derivar a Equação (7.95), começamos com 


Su e 1 [O ds1 [S v(t)dt 
i holas = f / v(s) ds / v(t)d Ns 
Sao STA E E SD Mao ba 


usando a Equação (7.86a) duas vezes. Integrando em primeiro lugar com relação a x, temos 


f_o dz = /. v(s) ds o 1 ih (s= S — 2): Ai 


l0Veja J. D. Jackson, Classical Electrodynamics, 3% ed. Nova York: Wiley (1999), Seções 7.7 e 7.10. A Equação (7.92) está em unidades 
gaussianas. 
HTsso significa que [°S |u(x)|? de e [So |v(x)|? da são finitas. 
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Pelo Exercício 7.2.8, a integração em x resulta em uma função delta: 


k m L = ô(s — t). 


T? J -œ (s— x)(t— zx) 


Temos 


a |u(x)|? da = a v(t) af v(s)ô(s — t) ds. (7.97) 


—00 — 00 —00 


Então, a integração em s é executada por inspeção, usando a propriedade definidora da função delta: 


a v(s)ô(s — t) ds = v(t). (7.98) 


—00 


Substituindo a Equação (7.98) na Equação (7.97), temos a Equação (7.95), a relação de Parseval. Mais uma vez, 
em termos de óptica, a presença de refração em algumas faixas de fregiência (n # 1) implica a existência de 
absorção e vice-versa. 


Causalidade 

A real significância das relações de dispersão na física é que elas são uma consegiiência direta de admitir que o 
sistema físico em questão obedece à causalidade. É difícil definir causalidade com precisão, mas o significado geral 
é que o efeito não pode preceder a causa. Uma onda espalhada não pode ser emitida pelo centro de espalhamento 
antes que a onda incidente tenha chegado até ele. Para sistemas lineares, a relação mais geral entre uma função de 
entrada G (a causa) e uma função de saída H (o efeito) pode ser escrita como 


H(t) = E F(t— t)G(t') dt. (7.99) 


Causalidade é imposta exigindo que 
F(t-t)=0 fort-t'<o0. 


A Equação (7.99) dá a dependência de tempo. A dependência de frequência é obtida tomando transformadas de 
Fourier. Pelo teorema da convolução de Fourier, Seção 15.5, 


em que f(w) é a transformada de Fourier de F(t), e assim por diante. Ao contrário, F(t) é a transformada de 
Fourier de f(w). 
A conexão com as relações de dispersão é dada pelo teorema de Titchmarsh.!? O teorema afirma que, se f(w) 
é de quadrado integrável sobre o eixo w real, então qualquer uma das três afirmativas a seguir implica as outras 
duas. 
1. A transformada de Fourier de f(w) é zero para t < 0, Equação (7.99). 
2. Substituindo w por z, a função f(z) é analítica no plano complexo z para y > 0 e se aproxima de f(x) quase 
em todo lugar à medida que y — 0. Além disso, 


Ha + iy)P de < K para y > 0; 


isto é, a integral é limitada. 
3. As partes real e imaginária de f(z) são transformadas de Hilbert uma da outra, Equações (7.86a) e (7.86b). 
Admitir que a relação entre a entrada e a saída de nosso sistema linear é causal (Equação (7.99)) significa que 


a primeira afirmativa é satisfeita. Se f (w) é de quadrado integrável, então o teorema de Titchmarsh tem a terceira 
afirmativa como conseqiiência e temos relações de dispersão. 


2Refira-se a E. C. Titchmarsh, Introduction to the Theory of Fourier Integrals, 2aa ed. Nova York: Oxford University Press (1937). Para 
uma discussão mais informal do teorema de Titchmarsh e mais detalhes sobre causalidade, veja J. Hilgevoord, Dispersion Relations and Causal 
Description. Amsterdam: North-Holland (1962). 
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Exercícios 


7.21 


7.2.2 


A função f(z) satisfaz as condições para as relações de dispersão. Além disso, f(z) = f*(2*), o 
princípio da reflexão de Schwarz, Seção 6.5. Mostre que f(z) é identicamente zero. 


Para f(z), tal que possamos substituir o contorno fechado da fórmula integral de Cauchy por uma 
integral sobre o eixo real, temos 


a e dd a 
=z Serf e toai 


Aqui, Cz, designa um semicírculo pequeno em torno de xo no semiplano inferior. Mostre que essa 
expressão se reduz a 


que é a Equação (7.84). 


(a) Para f(z) = e'”, a Equação (7.81) não é válida nas extremidades, arg z = 0,7. Mostre, com o 
auxílio do lema de Jordan, Seção 7.1, que a Equação (7.82) ainda é válida. 

(b) Para f(z) = e'*, verifique as relações de dispersão, Equação (7.89) ou Equações (7.90) e (7.91), 
por integração direta. 


Com f(x) = u(x) +iv(x) e f(x) = f*(—a), mostre que, à medida que zo — oo, 
(a) u(xo) ~ Pi xv(x) dz, 


(b) v(xo) ~Z f ue 


Na mecânica quântica, relações dessa forma são denominadas regras da soma. 


: 3 = =P [ u) dz, 


letgo TO louv-—zo 


(a) Dada a equação integral 


use transformadas de Hilbert para determinar u(xo). 
(b) Verifique se a equação integral da parte (a) é satisfeita. 
(c) Por f(2)ly=o = u(x) + iv(x), substitua x por z e determine f(z). Verifique se as condições 
para as transformadas de Hilbert são satisfeitas. 
(d) As condições de cruzamento são satisfeitas? 
Resposta: (a) u(xo9) = f a z © f(z) =(z +i) 
(a) Se a parte real do índice de refração complexo (ao quadrado) é constante (não há dispersão 
óptica), mostre que a parte imaginária é zero (não há absorção). 
(b) Ao contrário, se não há absorção, mostre que deve haver dispersão. Em outras palavras, se a 
parte imaginária de n? — 1 não é zero, mostre que a parte real de n? — 1 não é constante. 


Dadas u(x) = x/(x? + 1) e v(x) = —1/(x? + 1), mostre por avaliação direta de cada integral que 


[obe f poa. 


Resposta: / fue) do = f lv(x)|" de = F 


Considere u(x) = ô(x), uma função delta, e admita que as equações de transformadas de Hilbert 
são válidas. 


(a) Mostre que 


“livro” — 2007/8/1 — 15:06 — page 370 — #380 


370 Física Matemática Arfken e Weber ELSEVIER 


(b) Com mudanças de variáveis w = s — te x = s — y, transforme a representação ô da parte (a) 


em 1 na d 
(s-t) = / E 


T? J æ ( 


Nota: A função ô é discutida na Seção 1.15. 


7.2.9 Mostre que 
1 (®© dt 
oia a). Ut — x) 


é uma representação válida da função delta no sentido de que 
fo FESE) dr = 10) 


Admita que f(x) satisfaz a condição para a existência de uma transformada de Hilbert. 
Sugestão: Aplique a Equação (7.84) duas vezes. 


7.3 Método das Inclinações mais Acentuadas 


Panorama Analítico 

Ao analisar problemas de física matemática, muitas vezes achamos desejável conhecer o comportamento de uma 
função para grandes valores da variável ou algum parâmetro s, isto é, o comportamento assintótico da função. 
Exemplos específicos são fornecidos pela função gama (Capítulo 8) e por várias funções de Bessel (Capítulo 11). 
Todas essas funções analíticas são definidas por integrais 


r)= f F(z, s) dz, (7.100) 
C 


em que F é analítica em z e depende de um parâmetro real s. Escrevemos F(z) sempre que possível. 

Até aqui avaliamos tais integrais definidas de funções analíticas ao longo do eixo real deformando o caminho 
C para C” no plano complexo, portanto |F| torna-se pequena para todo z sobre C”. Esse método é bem-sucedido, 
contanto que ocorram somente pólos isolados na área entre C e C”. Os pólos são levados em conta pela aplicação 
do teorema dos resíduos da Seção 7.1. Os resíduos dão uma medição dos pólos simples, em que |F| — oo, que 
usualmente dominam e determinam o valor da integral. 

O comportamento da integral na Equação (7.100) depende claramente do valor absoluto |F| do integrando. 
Além disso, os contornos de |F| muitas vezes se tornam muito pronunciados à medida que s fica grande. Vamos 
focalizar uma plotagem de |F(x + iy)? = U?(x,y) + V2(x,y), em vez da parte real RF = U e da parte 
imaginária SF = V separadamente. Essa plotagem de |F|? sobre o plano complexo é denominada panorama 
analítico, nome dado por Jensen que, em 1912, provou que ela tem somente pontos de sela e cubas mas não 
tem nenhum pico. Além disso, as cubas descem até o plano complexo. Na ausência de pólos (simples), pontos de 
sela, são os próximos candidatos a dominar a integral na Equação (7.100). Daí o nome de método do ponto de 
sela. Em um ponto de sela, a parte real (ou imaginária) U de F tem um máximo local, o que implica que 


OU U 0 
Fo 

e, portanto, pela utilização das condições de Cauchy-Riemann da Seção 6.2, 
oV ƏV 0 
dr Oy | 


de modo que V tem um mínimo ou vice-versa e F'(z) = 0. O teorema de Jensen impede que U e V tenham um 
máximo ou um mínimo. Veja a Figura 7.18 para uma forma típica (e Exercícios 6.2.3 e 6.2.4). Nossa estratégia 
será escolher o caminho € de modo que ele passe sobre o ponto de sela, que dá a contribuição dominante e, 
em outros lugares, passe pelos vales. Se houver vários pontos de sela, tratamos cada um do mesmo modo, e suas 
contribuições serão adicionadas a T(s — 00). 

Para provar que não há picos, admita que haja um em 29. Isto é, |F(z9)|? > |F(2)|? para todo z de uma 
vizinhança |z — zo| < r. Se 


F(z) = 5 An(z — 20)” 
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é a expansão de Taylor em zo, o valor médio m( F) sobre o círculo z = zo + r exp(i) se torna 


m(F) 


27 
|F (zo + re'?) [É dy 
0 


1 2m WO g 
E X až anr treinam) dy 


27 0 m;n=0 
= Ý |an|?r” > jao}? = | F(zo)|P, (7.101) 
n=0 


usando ortogonalidade, + fe expi(n — m)y dy = ônm- Uma vez que m(F 
) 


círculo de raio r, deve existir um ponto zı sobre ele, tal que |F(21)|? > m(F 
admitimos. Por conseguinte, tal pico não pode existir. 

Em seguida, vamos admitir que haja um mínimo em zo, tal que 0 < |F(zo)|2 < |F(z)|2 para todo z de uma 
vizinhança de zo. Em outras palavras, o mergulho no vale não chega até o plano complexo. Então, |F(z)|2 > 0 
e, uma vez que 1/ F(z) é analítica nesse ponto, ela tem uma expansão de Taylor e 29 seria um pico de 1/|F(z)|2, 
o que é impossível. Isso prova o teorema da Jensen. Agora voltamos nossa atenção novamente para a integral na 
Equação (7.100). 


) é o valor médio de |F|? sobre o 
> |F(z0) 2, o que contradiz o que 


| 2 


Método do Ponto de Sela 


Visto que cada ponto de sela zọ se encontra necessariamente acima do plano complexo, isto é, |F (zọ)|? > 0, 
escrevemos F em forma exponencial, e!(2), em sua vizinhança sem perda de generalidade. Note que não ter 
nenhum zero no plano complexo é uma propriedade característica da função exponencial. Além do mais, qualquer 
ponto de sela com F(z) = 0 torna-se uma cuba de |F(z)|2 porque |F(2)|? > 0. Um caso em questão é a função 
z? em z = 0, em que d(22)/dz = 2z = 0. Aqui, 22 = (x + iy)? = x? — y? + 2ixy, e 2xy tem um ponto de sela 
em z = 0, assim como z? — y?, mas |z|4 tem uma cuba nesse lugar. 


fa, pl 


z 
Caminho de inclinação mais ES 


Figura 7.18: Um ponto de sela. 


Em 2 o plano tangencial é horizontal, isto é, 2E |z=z9 = 0 ou, o que é equivalente, 2 |lz-=z9 = 0. Essa condição 
localiza o ponto de sela. Nossa meta seguinte é determinar a direção de inclinação mais acentuada. Em 20, f 
tem uma série de potências 


F(z) = f(z0) + Sole —-2) +, (7.102) 
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ou A 
F(2) = (0) + 3 (7 (20) + €) (e — 20)’, (7.103) 
após reunir todas as potências mais altas em £ (pequeno). Por simplicidade, vamos considerar f” (zo) # O Então, 
Pwen =e, t real, (7.104) 
define uma reta que passa por zo (eixo do ponto de sela na Figura 7.18). Em zo, t = 0. Ao longo do eixo 
If (zo)(z — z0)? é zero e v = Sf(z) = Sf(zo) é constante se desprezarmos £ na Equação (7.103). A 


Equação (7.104) também pode ser expressa em termos de ângulos, 


1 
La arg f” (zo) = constante. (7.105) 


arg(z-29)=5 5 


Visto que |F(z)|2 = exp(2Rf) varia monotonicamente com Rf, |F(z)|? = exp(—t2) cai exponencialmente de 
seu máximo em t = 0 ao longo desse eixo. Daí o nome de inclinação mais acentuada. A reta que passa por zo 
definida por 

f(zo)l(z — 20)? = +? (7.106) 


é ortogonal a esse eixo (linha tracejada na Figura 7.18), o que é evidente por seu ângulo 


1 
arg(z — 20) = -3&8 f” (zo) = constante, (7.107) 
quando comparada com a Equação (7.105). Aqui, |F (z)|? cresce exponencialmente. 
As curvas Rf(z) = Rf (zo) passam por zo, portanto R[(f"(z9)+=)(z— 20)2] = 00u (f"(zo)+e)(z— 20)? = it 
para t. Expressando isso em ângulos como 


1 

arg(z — zo) = í S arg( f” (z0) +€), t>0, (7.108a) 
1 

arg(z — 20) = E - zarg(f” (z) +e),  t<o, (7.108b) 


e comparando com as Equações (7.105) e (7.107), notamos que essas curvas (linhas traço-ponto na Figura 
7.18) dividem a região do ponto de sela em quatro setores, dois com Rf(z) > Rf(zo) (por conseguinte 
|F(z2)| > |F (z0)|), sombreados na Figura 7.18, e dois com Rf(z) < Rf (zo) (por conseguinte, |F(2)| < |F(z9)). 
Eles formam ângulos +% com o eixo. Assim, o caminho de integração tem de evitar as áreas sombreadas, em 
que |F| cresce. Se for escolhido um caminho para subir as inclinações acima do ponto de sela, a parte imaginária 
grande de f(z) leva a oscilações rápidas de F(z) = e!(2) e cancela contribuições à integral. 

Até aqui, nosso tratamento tem sido geral, exceto para f”(zọ) # 0, que pode ser amenizado. Agora 
estamos prontos para especificar o integrando F ainda mais, de modo a vincular a seleção do caminho com 
o comportamento assintótico, à medida que s — oo. 

Admitimos que s aparece linearmente no expoente, isto é, substituímos exp f(z,s) — exp(sf(z)). Essa 
dependência de s assegura que a contribuição do ponto de sela em zo cresça com s — oo, resultando em inclinações 
acentuadas, como é o caso na maioria das aplicações em física. Para dar conta da região distante do ponto de sela 
que não é influenciada por s, incluímos uma outra função analítica, g(z), que varia lentamente perto do ponto de 
sela e é independente de s. 

Então, no geral, nossa integral tem a forma mais apropriada e específica 


I(s) = ! g( Def dz. (7.109) 
C 


O caminho da inclinação mais acentuada é o eixo do ponto de sela quando desprezamos os termos de ordem mais 
alta, €, na Equação (7.103). Com £, o caminho da inclinação mais acentuada é a curva próxima ao eixo dentro dos 
setores não-sombreados, em que v = S f (z) é estritamente constante, enquanto 3 f (z) é apenas aproximadamente 
constante sobre o eixo. Aproximamos 7(s) pela integral ao longo do pedaço do eixo que está dentro do trecho na 
Figura 7.18, em que (compare com a Equação (7.104)) 


. 1 
z = zo + ue”, a= 5-38 f" (o), a<ar<b. (7.110) 
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Achamos R 
Ils) x ee / g(zo + xet“) exp[sf(zo + ve')] dz, (7111a) 


e a parte omitida é pequena e pode ser estimada porque R(f(z) — f(zo)) tem um limite superior negativo, 
digamos — R, que depende do tamanho do trecho do ponto de sela na Figura 7.18 (isto é, os valores de a,b na 
Equação (7.110)) que escolhemos. Na Equação (7.111) usamos as expansões de potências 


F(zo + ve') = f(z0) + 1 f" (zo) +e, 


; 7 ; (7.111b) 
g(z0 + xe!) = g(z0) + g'(z0) r+, 
e nos lembramos pela Equação (7.110) que 
1 Zia 1 
zf Coe = -35|f" o)l <0. 
Para o termo dominante para s — oo encontramos: 
a 5 b 1 UA 2 
I(s) = glozet eoe f eTl Coll dg, (7.112) 


Uma vez que o integrando na Equação (7.112) é essencialmente zero quando x se afasta consideravelmente da 
origem, deixamos que b — œ e a — —oo. O pequeno erro envolvido pode ser estimado diretamente. Notando que 
a integral remanescente é exatamente uma integral de erro de Gauss, 


finalmente obtemos 


TNT 
i= 


em que a fase a foi introduzida nas Equações (7.110) e (7.105). 
Uma nota de alerta: admitimos que a única contribuição significativa à integral veio da vizinhança imediata 
do(s) ponto(s) de sela(s) z = zo. Essa condição deve ser verificada para cada novo problema (Exercício 7.3.5). 


(7.113) 


Exemplo 7.3.1 FORMA ASSINTÓTICA DA FUNÇÃO DE HANKEL HM (5) 
Na Seção 11.4 mostramos que as funções de Hankel, que satisfazem a equação de Bessel, podem ser definidas por 


1 ooet d 
HO (s) = F Toan (7.114) 
ML C4,0 Z 
0 
HO(s) = F el/De-19 dE (7.115) 
Ti JO, ooer zY 


2 


O contorno Cı é a curva no semiplano superior da Figura 7.19. O contorno Cə está no semiplano inferior. 
. É SOES à SESAR E 1 / 
Aplicamos o método das inclinações mais acentuadas à primeira função de Hankel, HS (9), que está 


convenientemente na forma especificada pela Equação (7.109), com f(z) dada por 


1 1 
fe) = (-- J (7.116) 
2 z 
Diferenciando, obtemos 
1 1 
(z) = =+ ==. 7.117 
Pe=5+5 1117 
Estabelecendo f'(z) = 0, obtemos 
FR o (7.118) 
Por conseguinte, há pontos de sela em z = +i e z = —i. Em z = i, f” (i) = —iouargf"(i) = —7/2, de 


modo que a direção do ponto de sela é dada pela Equação (7.110) como a = 5 + F = im. Para a integral para 
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linha de corte 


Figura 7.19: Contornos da função de Hankel. 


H OD (5) devemos escolher o contorno que passa pelo ponto z = +i, de modo que ele comece na origem, passe 
tangencialmente para fora do eixo real positivo e então prossiga em curva, passando pelo ponto de sela em z = +i 
na direção dada pelo ângulo a = 37/4 e então continue até menos infinito assintoticamente ao eixo negativo 
real. O caminho de subida mais acentuada, que devemos evitar, tem a fase —5 arg f” (i) = %, de acordo com a 
Equação (7.107), e é ortogonal ao eixo, nosso caminho de inclinação mais rápido. 

Substituição direta na Equação (7.113) com a = 37 /4 agora resulta em 


1 V92mi—v—1e(s/Di-1/D gsmi/4 


HD(s) = 
OT EDTA 
= 2 dim/)(-v-2) pis pi(87/4), (71 19) 
Vas 
Combinando termos, obtemos 
HP (s) ~ 2 ei(s=v(a/2) -1/4 (7.120) 


TS 


como o termo dominante da expansão assintótica da função de Hankel H, o (s). Se desejarmos termos adicionais, 
podemos pegá-los da série de potências de f e g na Equação (7.111b). A outra função de Hankel pode ser tratada 
de modo semelhante usando o ponto de sela em z = —i. E 


Exemplo 7.3.2 FORMA ASSINTÓTICA DA FUNÇÃO FATORIAL 

Em muitos problemas físicos, em particular no campo da mecânica estatística, é desejável ter uma aproximação 
precisa da função gama ou fatorial de números muito grandes. Conforme desenvolvimento na Seção 8.1, a função 
fatorial pode ser definida pela integral de Euler 


T(1 +s) S) prot do =s! | esUnz-2) dz. (7.121) 
0 0 


Aqui fizemos a substituição p = zs, de modo a converter a integral à forma requerida pela Equação (7.109). Como 
antes, supomos que s é real e positivo, do qual se segue que o integrando se anula nos limites O e oo. Diferenciando 
a dependência de z que aparece no expoente, obtemos 
df(z) d 1 1 
l = "(z= -> 7.122 

dz a nz z) z , f (2) 22º ( ) 
que mostra que o ponto z = 1 é um ponto de sela e arg f”(1) = arg(—1) = 7. De acordo com a Equação (7.109), 
deixamos 


ia Gia, M 5 T T 
2—-1=ge!”, a z 8 É (D=s5 370 (7.123) 
com x pequeno, para descrever o contorno na vizinhança do ponto de sela. Disso vemos que a direção de 
inclinação mais acentuada está ao longo do eixo real, uma conclusão a que poderíamos ter chegado mais ou menos 
intuitivamente. 


Substituição direta na Equação (7.113) com a = 0 agora resulta em 


dmsttlers 


PEES (1.124) 


r1 +s) 7x 
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Assim, o primeiro termo na expansão assintótica da função fatorial é 
Pd +s)a v2rss e5. (7.125) 


Esse resultado é o primeiro termo da expansão de Stirling da função fatorial. O método de inclinação mais 
acentuada é provavelmente o modo mais fácil de obter esse primeiro termo. Se desejarmos mais termos na 
expansão, então é preferível o método da Seção 8.3. E 

No exemplo precedente o cálculo foi executado admitindo que s é real, uma admissão que não é necessária. 
Podemos mostrar (Exercício 7.3.6) que a Equação (7.125) também vale quando s é substituído pela variável 
complexa w, contanto que seja imposta condição, que a parte real de w seja grande e positiva. 

Limites assintóticos de representações integrais de funções são de extrema importância em muitas aproximações 
e aplicações na física: 


; f'(zo) = 0. 


f glz) dz m v279(20) es! Co) eia 
Cc |s f” (zo)l 


O método do ponto de sela é uma opção primorosa para derivá-las e pertence à caixa de ferramentas de todo 
físico e engenheiro. 


Exercícios 
7.3.1 Usando o método de inclinações mais acentuadas, avalie a segunda função de Hankel, dada por 
0 
Hom / els/2e- 1/2) JE 
4 Ti J C2 qual 


com contorno C2, como mostra a Figura 7.19. 


2 . 
Resposta: HO) (s) = 4/ e 'te=m/4-vn/3), 
TS 


7.3.2 Ache o caminho mais acentuado e a expansão assintótica dominante para as integrais de Fresnel 
Jo cosa? dæ, fy sen x? dz. 
Sugestão: Use J eis?’ dz, 

7.3.3 (a) Ao aplicar o método de inclinação mais acentuada à função de Hankel H W (s), mostre que 


RC] <R[fGo)] = 0 


para z sobre o contorno C1 mas distante do ponto z = 29 = 1. 
(b) Mostre que 


wa 


RLf(2)) >0 para 0<r<1, 


R| f(z] <0 para r>1, <0<5 


(Figura 7.20). É por isso que Cı pode não ser deformado para passar pelo segundo ponto de sela, 
z = —i. Compare e verifique as linhas traço-ponto na Figura 7.18 para esse caso. 


7.3.4 Determine a dependência assintótica das funções modificadas de Bessel 7, (x), dada 


1 dt 
PE (x/2)(t+1/t) 2 
Ile) = z [é AE 


O contorno começa e termina em t = —oo, circundando a origem em um sentido positivo. Há 


dois pontos de sela. Somente o ponto de sela em z = +1 contribui significativamente para a forma 
assintótica. 


7.3.5 Determine a dependência assintótica da função modificada de Bessel da segunda espécie, K, (x), 
usando 


E | Elo 2/2(8+1/s) 48 _ 


l-v 
2 Jo s 
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Figura 7.20: 


7.3.6 Mostre que a fórmula de Stirling, 
TA + 8) x v2mss es, 


é válida para valores complexos de s (com R(s) grande e positivo). 
Sugestão: Isso envolve designar uma fase a s e então exigir que 3[s f(z)| = constante na vizinhança 
do ponto de sela. 


7.3.7 Admita que H wW (s) tem uma expansão negativa de série de potências da forma 


AOs [2 Ms-v(r/2)-n/4) Sans", 
TS 
n=0 


sendo que o coeficiente do somatório é obtido pelo método da inclinação mais acentuada. Substitua 


na equação de Bessel e mostre que você reproduz a série assintótica para H OD (5) dada na Seção 
11.6. 


Leituras Adicionais 

Nussenzveig, H. M., Causality and Dispersion Relations, Mathematics in Science and Engineering Series, vol. 95. 
Nova York: Academic Press (1972). Texto avançado que trata de causalidade e relações de dispersão no primeiro 
capítulo e então passa a desenvolver as implicações em uma variedade de áreas da física teórica. 

Wyld, H. W., Mathematical Methods for Physics. Reading, MA: Benjamin/Cummings (1976), Perseus Books 
(1999). Texto relativamente avançado que contém uma discussão extensiva de relações de dispersão. 


“livro” — 2007/81 — 15:06 — page 377 — #387 


8 


A Função Gama (Função Fatorial) 


A função gama aparece ocasionalmente em problemas físicos tais como a normalização de funções de onda de 
Coulomb e o cálculo de probabilidades em mecânica estatística. Contudo, em geral, ela tem menos aplicação física 
direta e interpretação do que, digamos, as funções de Legendre e Bessel dos Capítulos 11 e 12. Mais exatamente, 
sua importância se origina de sua utilidade para o desenvolvimento de novas funções que têm aplicação física 
direta. Portanto, incluímos aqui a função gama. 


8.1 Definições, Propriedades Simples 

Há, em uso corrente, pelo menos três definições diferentes e convenientes da função gama. Nossa primeira tarefa 
é enunciar essas definições, desenvolver algumas conseqüências simples, diretas, e mostrar a equivalência das três 
formas. 


Limite Infinito (Euler) 
A primeira definição, que deve seu nome a Euler, é 


1.2.3... 
P(2) = lim pen 


= z(z+1)(z +2) e (z+n) | z #4 0,—1,—2,—3,.... (8.1) 


n 


Essa definição de T(z) é útil no desenvolvimento da forma de produto infinito de Weierstrass de T(z), 
Equação (8.16), e na obtenção da derivada de InT (z) (Seção 8.2). Aqui e em outros lugares neste capítulo, z 
pode ser ou real ou complexo. Substituindo z por z + 1, temos 


: 1.2.3...n s 
ERUS CGE E 
= nz 1.2.3-..n nº 
n>œoz+n+1 (z+D(2+2)---(2+n) 
= 2D(2). (8.2) 


Essa é a relação funcional básica para a função gama. Devemos observar que é uma equação de recorrência. 
Já demonstramos que a função gama pertence a uma classe geral de funções que não satisfazem nenhuma 
equação diferencial com coeficientes racionais. Especificamente, a função gama é uma das poucas funções da 
física matemática que não satisfazem nem a equação diferencial hipergeométrica (Seção 13.4) nem a equação 
hipergeométrica confluente (Seção 13.5). 


Além disso, pela definição, 
1.2.3...n 
Tr(1)= li =1. é 
(e O (8.3) 


Agora, a aplicação da Equação (8.2) resulta em 


T(3) = (2) = 2,... (8.4) 
T(n)=1-2-3---(n—1)=(n-1)!. 
Integral Definida (Euler) 


Uma segunda definição, que também é freqüentemente denominada integral de Euler, é 


ro= f et! dt, R(z) > 0. (8.5) 
0 


377 
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A restrição imposta a z é necessária para evitar divergência da integral. Quando a função gama aparece em 
problemas físicos, fregiientemente é nessa forma ou em alguma variação dela, tal como 


r(e) =2 f cd,  R(2) >0. (8.6) 
0 


OE / WE a (2) > 0. (8.7) 


Quando z = > a Equação (8.6) é exatamente a integral de erro de Gauss, e temos o interessante resultado 
D(5) = yT. (8.8) 


Generalizações da Equação (8.6), as integrais gaussianas são consideradas no Exercício 8.1.11. Essa forma de 
integral definida de I (z), Equação (8.5), leva à função beta, Seção 8.4. 
Para mostrar a equivalência dessas duas definições, Equações (8.1) e (8.5), considere a função de duas variáveis 


n t n 
F(z, n) = [ (1 — 3 t! dt, R(z) > 0, (8.9) 
0 n 
sendo n um inteiro positivo.! Visto que 
t n 
lim (1 — z) Ser, (8.10) 
n—00 n 
pela definição da exponencial 
lim F(z,n) = F(2z,00) = [ et l dt =T(2) (8.11) 
n—00 0 


pela Equação (8.5). 
Voltando a F'(z,n), vamos avaliá-la em integrações sucessivas por partes. Por conveniência, seja u = t/n. 
Então, 


1 
F(z,n) = é f (1 — uu du. (8.12) 
0 


Integrando por partes, obtemos 


1 
+= [ (1 — u)? tu? du. (8.13) 
0 


Repetindo essa operação com a parte integrada que se anula em ambas as extremidades cada vez, finalmente 
obtemos 


E a Er 

F(z,n)=n II |, u du 
1-2.3. n ; 

-EDER CE (8.14) 


Essa expressão é idêntica à do lado direito da Equação (8.1). Por conseguinte, 


lim F(z,n) = F(z,00) =T(2), (8.15) 


n—00 


pela Equação (8.1), concluindo a prova. 


1A forma de F(z, n) é sugerida pela função beta (compare com a Equação (8.60). 
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Produto Infinito (Weierstrass) 
A terceira definição (forma de Weierstrass) é 


1 z T K —2/n 
TE) = ze” JI (1 + Ee / ; (8.16) 


em que y é a constante de Euler-Mascheroni, 


y = 0,5772156619.... (8.17) 


Essa forma de produto infinito pode ser usada para desenvolver a identidade de reflexão, Equação (8.23), e aplicada 
nos exercícios, tal como o Exercício 8.1.17. Essa forma pode ser derivada da definição original (Equação (8.1)), 
reescrevendo-a como 


1:2-3 n 146 A Va 
DP) = li *= lim = 1+— A 8.18 
O= lim E” a z I( +5) É (8.18) 
Invertendo a Equação (8.18) e usando 
no? = e0 n), (8.19) 
obtemos 
1 2 z 
=z lim qo A 1+2). .2 
ra z lim e II + T (8.20) 
Multiplicando e dividindo por 
1 1 1 z 
SEE EA = z/m 
epl(1+ A i 3 = IIe À (8.21) 


obtemos 


(8.22) 


Como mostramos na Seção 5.2, os parênteses no expoente aproximam-se de um limite, a saber, y, a constante 
de Euler-Mascheroni. Por conseqgiiência, resulta a Equação (8.16). Mostramos na Seção 5.11 que a definição de 
produto infinito de Weierstrass de ~y levava diretamente a uma importante identidade, 


R 


r(2)Tr(1-z)= (8.23) 


senzr ` 


Alternativamente, podemos partir do produto de integrais de Euler 


r(z+1)r(1- z) sl steds f t e™ dt 
0 0 


=| vrf tudu di 
E (v +1)? Jo sen 7z’ 


transformando a partir das variáveis s, t para u = s + t, v = s/t, como sugerido pela combinação de exponenciais 
e potências nos integrandos. O jacobiano é 


1 | s+t č (w+1? 
o uv 


em que (v + 1)t = u. A integral die e™ “udu = 1, ao passo que, sobre v, pode ser derivada por integração de 
contorno, dando or E 
Essa identidade também pode ser derivada por integração de contorno (Exemplo 7.1.6 e Exercícios 7.1.18 e 


7.1.19) e a função beta, Seção 8.4. Fazendo z = 5 na Equação (8.23), obtemos 
D(5) = vr (8.24a) 
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(tomando a raiz quadrada positiva), de acordo com a Equação (8.8). 
De modo semelhante , podemos estabelecer a fórmula de duplicação de Legendre, 


Pa +D(2+5)=272V7D(22+1). (8.24b) 

A definição de Weierstrass mostra imediatamente que T (z) tem pólos simples em z = 0, —1, —2, —3, . . . e que 
[7 (2)]"! não tem nenhum pólo no plano complexo finito, o que significa que T(z) não tem nenhum zero. Esse 
comportamento também pode ser observado na equação (8.23), na qual notamos que 7/(sen 7z) nunca é igual a 
Zero. 

Na verdade, a definição de produto infinito de I (z) pode ser derivada do teorema da fatorização de Weierstrass, 
especificando que [IT (z)]7} tem zeros simples em z = 0,-1,-2,-3,.... A constante de Euler-Mascheroni é 
fixada impondo que T'(1) = 1. Veja também as expansões de produto de funções inteiras na Seção 7.1. 

Na teoria da probabilidade, a distribuição gama (densidade de probabilidade) é dada por 


1 1 
o-1p-2/B 
z Te e À a >0 
f(æ)=4 oo) (8.240) 
0, x <o0. 


A constante [6ºT(a)|”! é escolhida de modo que a probabilidade total (integrada) seja igual à unidade. Para 
x — E, energia cinética, œ — 3, a Equação (8.24c) resulta na clássica estatística de Maxwell-Boltzmann. 


Notação Fatorial 

Até aqui essa discussão foi apresentada em termos da notação clássica. Como mostrado por Jeffreys e outros, o —1 
do expoente z — 1 em nossa segunda definição (Equação (8.5)) é um aborrecimento constante. Por consegiiência, 
a Equação (8.5) às vezes é reescrita como 


f e*t dt=z2!, R(z) > —1, (8.25) 
0 


para definir uma função fatorial z!. Ocasionalmente, ainda podemos encontrar a notação de Gauss, | (z), para a 
função fatorial: 


[to =<=T(+0). (8.26) 
A notação I se deve a Legendre. A função fatorial da Equação (8.25) é relacionada à função gama por 
P()= (2-1)! ou r(z+1)=z2!. (8.27) 
Se z = n, um inteiro positivo (Equação (8.4)), mostre que 
d=>3=1:2.3...n, (8.28) 


o familiar fatorial. Contudo, devemos notar que, uma vez que 2! agora é definido pela Equação (8.25) (ou, o que é 
equivalente, pela Equação (8.27)), a função fatorial não é mais limitada a valores inteiros positivos do argumento 
(Figura 8.1). 

A relação de diferença (Equação (8.2)) se torna 


z! 


(z=-1!= ^. (8.29) 
z 
Isso mostra imediatamente que 
0!=1 (8.30) 
e 
n! = +00 para n, um inteiro negativo. (8.31) 
Em termos do fatorial, a Equação (8.23) se torna 
zl(—2)= — (8.32) 


sen mz. 
Restringindo-nos aos valores reais do argumento, constatamos que l (x + 1) define as curvas mostradas nas 


Figuras 8.1 e 8.2. O mínimo da curva é 
T(x + 1) = z! = (0,46163 ...)! = 0,88560 .... (8.33a) 
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D(x+1) 


N wo A a 


Figura 8.1: A função fatorial — extensão para argumentos negativos. 


Notação de Fatorial Duplo 

Em muitos problemas de física matemática, em particular em conexão com polinômios de Legendre (Capítulo 12), 
encontramos produtos dos inteiros positivos fmpares e produtos dos inteiros positivos pares. Por conveniência, eles 
recebem rótulos especiais como fatoriais duplos: 


1-3-5- (2n+1) = (2n+1)!! 
(8.33b) 
2-4-6- (2n) = (2n)! 
É claro que estão relacionados com as funções fatoriais regulares por 
2 1)! 
(n) =n!) e (2n+1)!= no (8.330) 
Pal 
Também definimos (—1)!! = 1, um caso especial que não resulta da Equação (8.33c). 
Representação Integral 
Uma representação integral útil no desenvolvimento de séries assintóticas para as funções de Bessel é 
f ez" dz = (2 — 1) (w +1), (8.34) 
C 


em que C é o contorno mostrado na Figura 8.3. Essa representação de integral de contorno só é útil quando v não 
é um inteiro e, então, z = 0 é um ponto de ramificação. A Equação (8.34) pode ser verificada de imediato para 
v > —1 deformando o contorno, como mostra a Figura 8.4. A integral desde œo até a origem resulta em —(v!), 
colocando a fase de z em 0. A integral que vai até infinito (no quarto quadrante) resulta em e27*”p!, sendo que a 
fase de z aumentou para 27. Uma vez que o círculo ao redor da origem nada contribui quando v > —1, resulta a 
Equação (8.34). 

Muitas vezes é conveniente apresentar esse resultado sob uma forma mais simétrica: 


1 e“(—-2)" dz = 2il (v + 1)sen(vr). (8.35) 
c 
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LnrQ+1) 


d? 
zan T&œ+1) 


2 
Zm r&+1) 


-L inro+1) 


-1.0 0 1.0 2.0 30 4.0 


Figura 8.2: A função fatorial e as duas derivadas de primeira ordem de In(T (x + 1)). 


>< 


Figura 8.3: Contorno de função fatorial. 


Linha de corte 


Figura 8.4: Contorno da Figura 8.3 deformado. 
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Essa análise estabelece as Equações (8.34) e (8.35) para v > —1. É relativamente simples ampliar a faixa para 
incluir todos os v não-inteiros. Em primeiro lugar, observamos que a integral existe para v < —1, contanto que 
fiquemos distantes da origem. Em segundo lugar, integrando por partes constatamos que a Equação (8.35) resulta 
na familiar relação de diferença (Equação (8.29)). Se tomarmos a relação de diferença para definir a função fatorial 
de v < —1, então as Equações (8.34) e 8.35) são verificadas para todo v (exceto inteiros negativos). 


Exercícios 


8.1.1 Derive as relações de recorrência 
P(2+1) = T(z) 


a partir da integral de Euler (Equação (8.5)), 


D0 
P(2) = f etpol dt. 
0 
8.1.2 Em uma solução de série de potências para as funções de Legendre da segunda espécie, encontramos 


a expressão 


(n + 1)(n+2)(n+3)--- (n +2s-— D(n +25) 
2-4-6-8--- (2s — (25) -(2n+3)(2n+5)(2n+47)---(2n+25+ 1)’ 


na qual s é um inteiro positivo. Reescreva essa expressão em termos de fatoriais. 
8.1.3 Mostre que, à medida que s — n — inteiro negativo, 


(s— n)! (— 1)" S(2n — 28)! 
(2s — 2n)! (n — s)! 


Aqui, s e n são inteiros, sendo s < n. Esse resultado pode ser usado para evitar fatoriais negativos, 
tal como nas representações de série das funções esféricas de Neumann e das funções de Legendre 
da segunda espécie. 


8.1.4 Mostre que T (z) pode ser escrita 


D(z) = 2 et pla, R(z) > 0, 
o 


ro = f WE) a (2) > 0. 


8.1.5 Em uma distribuição maxwelliana a fração de partículas com velocidade entre v e v + dv é 


dN m 3/2 mu? 2 
N` a) SSR (- ET)? du, 


sendo N o número total de partículas. A média ou valor esperado de v” é definida como (v”) = 


No! f v” dN. Mostre que 
n/2p(n+3 
m) TG 


8.1.6 Transformando a integral em uma função gama, mostre que 


1 
1 
k 
= ln z dz = ———— k > 1. 
Ts nx dx (EAD > 


8.1.7 Mostre que 


8.1.8 Mostre que 


384 
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8.1.9 
8.1.10 
8.1.11 


8.1.12 


8.1.13 


8.1.14 


8.1.15 


8.1.16 


8.1.17 


8.1.18 


Localize os pólos de T (z). Mostre que são pólos simples e determine os resíduos. 
Mostre que a equação x! = k, k 0, tem um número infinito de raízes reais. 


Mostre que 


oo 1 
2s+1 2 — S 
(a) I x exp(—ax ) dz = Jqs+1' 


oo Doda) — DI! 
a 5 o (s— 35)! = (2s—1)! fr 
(b) A T exp(—ax ) dx Sagt Diigo Ae 


Essas integrais gaussianas são de extrema importância em mecânica estatística. 


(a) Desenvolva relações de recorrência para (2n)!! e para (2n + 1)!!. 
(b) Use essas relações de recorrência para calcular (ou definir) 0!! e (—1)!!. 


Resposta: 0! = 1, (—1)! = 1. 
Para s inteiro não-negativo, mostre que 
a O O 
(2s—1)!! (28)! 


(—2s — 1)! = 
Expresse o coeficiente do enésimo termo da expansão de (1 + )!/2 


(a) em termos dos fatoriais de inteiros, 
(b) em termos das funções de fatorial duplo (!!) 


(Qn—-3)! nad (2n — 3)! 
22n-2nl(n — 2)! SE 


Expresse o coeficiente do enésimo termo da expansão de (1 + w)—!/2 


Resposta: an = (—1)” Tt 


(a) em termos dos fatoriais de inteiros, 
(b) em termos das funções de fatorial duplo (!!). 
, n (2n)! n 
Resposta: an = (—1) Pon =(—1) 


O polinômio de Legendre pode ser escrito como 


n=1,2,3,.... 


— DI! 
Palcos 0) = o (cosnê + E cos(n — 2)0 
n)!! n— 


n(n — 1) 
(2n — 1)(2n — 3) 

n(n — D(n — 2) | | 
ERROR a eh 


cos(n — 4)0 


5 
-3 
Seja n = 2s + 1. 


Pa(cos 0) = Pzs+1(cos 0) = se am cos(2m + 1)0. 
m=0 
Ache am em termos de fatoriais e de fatoriais duplos. 
(a) Mostre que 
T(n) (4 +n) = (1), 


em que n é um inteiro. 
b) Expresse T(t +n) er(} — n) separadamente em termos de 71/2 e de uma função a. 
p 3 2 p ç 


2n — 1)! 
Resposta: (5 + n) = ncia, 
Por uma das definições da função fatorial ou função gama, mostre que 


NX 


lliz)!” = 


senh mx 
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8.1.19 Prove que 
oo B? —1/2 
Ma + i8)| = |E (@)| HI h PSA =| 
Essa equação tem sido útil em cálculos da teoria da degradação beta. 
8.1.20 Mostre que 


1/2 n 
Tb 1/2 
b)!| = 2 4? 
n+: ) | (es) He ia 
para n, um inteiro positivo. 
8.1.21 Mostre que 
let) > [a + iy)! 
para todo x. As variáveis x e y são reais. 


8.1.22 Mostre que 
T 


Eaa = 
PG + iv) “ coshry. 


8.1.23 A densidade de probabilidade associada com a distribuição normal da estatística é dada por 


2 
E] (e o, 


202 


com a faixa de (—o0, 00). Mostre que 
) é igual a ju, 


) 
(a) o valor médio de x, (a: 
2) — (x)2)!/2 é dado por o. 


(b) o desvio-padrão ((x 
8.1.24 Pela distribuição gama 


mostre que 


(a) (x) (média) = aß, (b) o? (variância) = (x?) — (x)? = ap? 
8.1.25 A função de onda de uma partícula dispersa por um potencial de Coulomb é y(r, 8). Na origem a 


função de onda se torna 
(O) = e77 T + im, 


em que y = Z1 Z2e?/ħw. Mostre que 


21% 
ey — 1º 


lvo)? = 


8.1.26 Derive a representação de integral de contorno da Equação (8.34), 
2iv!sen vm = / e“(—2)" dz. 
(o) 


8.1.27 Escreva um subprograma de função FACT(N) (variável independente de ponto fixo) para calcular 
N!. Inclua provisão para rejeição e mensagem de erro adequada se N for negativo. 


Nota: Para N inteiro pequeno, multiplicação direta é mais simples. Para N grande, a 
Equação (8.55), a série de Stirling, seria adequada. 


8.1.28 (a) Escreva um subprograma de função para calcular a razão de fatoriais duplos (2N — 1)! /(2N)!!. 
Inclua provisão para N = 0 e para rejeição e uma mensagem de erro se N for negativo. Calcule 
e tabule essa razão para N = 1(1)100. 
(b) Verifique o cálculo de seu subprograma de função para 199!!/200!!. em comparação com o 
valor obtido pela série de Stirling (Seção 8.3). 


“livro” — 2007/8/1 — 15:06 — page 386 — #396 


386 Física Matemática Arfken e Weber ELSEVIER 


199!! 
R t = 0, 056348. 
esposta: Z001 


8.1.29 Usando GAMMA fornecida pelo FORTRAN ou uma sub-rotina fornecida por uma biblioteca para 
x! ou T(x), determine o valor de x para o qual T(x) é um mínimo (1 < x < 2) e esse mínimo 
valor de T (x). Observe que, embora o valor mínimo de T(x) possa ser obtido até cerca de cinco 
algarismos significativos (precisão única), o valor correspondente de x é muito menos preciso. Por 
que essa precisão relativamente baixa? 


8.1.30 A função fatorial expressa em forma integral pode ser avaliada pela quadratura de Gauss-Laguerre. 
Para uma fórmula de 10 pontos o x! resultante é teoricamente exato para x inteiro, de O até 
19. O que acontece se x não for um inteiro? Use a quadratura de Gauss-Laguerre para avaliar 
x = 0,0(0, 1)2, 0. Tabule o erro absoluto como uma função de z. 


Valor de verificação. 1 lexato — L!quadratura = 0,00034 para v=1,3. 


8.2 Funções Digama e Poligama 


Funções Digama 
Como podemos notar pelas três definições na Seção 8.1, é inconveniente lidar diretamente com as derivadas 
da função gama ou função fatorial. Em vez disso, costuma-se tomar o logaritmo natural da função fatorial 
(Equação (8.1)), converter o produto em uma soma e então diferenciar: isto é, 

n! 


Pe +D=A(2)= dim CENTERS PEER a (8.36) 


InT(z+1)= lim [In(n!)+zlnn—lIn(z+1) 
—In(z+2)---—In(z+n)), (8.37) 


na qual o logaritmo do limite é igual ao limite do logaritmo. Diferenciando em relação a z, obtemos 


d . 1 1 1 
E wre+)=ve+1)= lim (inn 234 z+2 =)» (8:38) 


que define y(z + 1), a função digama. Pela definição da constante de Euler-Mascheroni,? a Equação (8.38) pode 
ser reescrita como 


MEE Hm 3 


n=1 


=- wa (8.39) 


aai 


Uma aplicação da Equação (8.39) é na derivação da forma de série da função de Neumann (Seção 11.3). É claro 
que 
y(1) = —y = —0, 577 215 664901....º (8.40) 


Um outra expressão para %(z), talvez mais útil, é derivada na Seção 8.3. 


Função Poligama 
A função digama pode ser diferenciada repetidas vezes, dando origem à função poligama: 


m dart 
1 
E m+1 zo 
= (—1) mY em m= 1,2,3,.... (8.41) 


n=1 


“Compare com as Seções 5.2 e 5.9. Somamos e subtraímos 51%. sol, 
3y foi calculada até 1.271 casas decimais por D. E. Knuth, Math. ‘Compu, 16: 275 (1962), e até 3.566 casas decimais por D. W. Sweeney, 


ibid. 17: 170 (1963). Talvez seja interessante saber que a fração 228/395 dá y com precisão até seis casas decimais. 
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Um esboço de y(x + 1) e w)'(x + 1) está incluída na Figura 8.2. Uma vez que a série na Equação (8.41) define a 
função zeta de Riemann? (com z = 0), 


2 1 
tm)=> a (8.42) 
n=1 
temos 
Y™® (1) = (11) tmem+D, m=1,23,... (8.43) 


Os valores das funções poligama de argumento inteiro positivo, pt (m + 1), podem ser calculados usando o 
Exercício 8.2.6. 
Em termos da notação I, talvez mais comum, 


aa Mhe) = (2) = pt (z). (8.443) 
z 

Expansão de Maclaurin, Cálculo 

Agora é possível escrever uma expansão de Maclaurin para InT (z + 1): 


mr(z+1)=ġ_ ED) = —yz + Sneen) (8.44b) 
n=1 * n=2 


convergente para |z| < 1; para z = x, a faixa é —1 < x < 1. Formas alternativas dessa série aparecem no 
Exercício 5.9.14. A Equação (8.44b) é um meio possível para calcular T(z + 1) para z real ou complexo, mas a 
série de Stirling (Seção 8.3) costuma ser melhor e, além disso, agora estão disponíveis excelentes tabelas de valores 
da função gama para argumentos complexos com base na utilização da série de Stirling na relação de recorrência 
(Equação (8.29)) está agora disponível. 


Somatório de Séries 

As funções digama e poligama também podem ser usadas em séries de somatórios. Se o termo geral da série 
tem a forma de uma fração racional (com a potência mais alta do índice no numerador ao menos duas unidades 
menor do que a potência mais alta do índice no denominador), ele pode ser transformado pelo método de frações 
parciais (compare com a Seção 15.8). A série infinita então pode ser expressa como uma soma finita de funções 
digama e poligama. A utilidade desse método depende da disponibilidade de tabelas de funções digama e poligama. 
Essas tabelas e exemplos de somatório de séries são dados em AMS-55, Capítulo 6 (veja referência em Leituras 
Adicionais). 


Exemplo 8.2.1 CONSTANTE DE CATALAN 
A constante de Catalan, Exercício 5.2.22, ou 8(2) da Seção 5.9, é dada por 
(= 


K=6(2)= RREO 8.44 
k=0 
Agrupando os termos positivos e negativos separadamente e começando com índice unitário (para se ajustar à 


forma de ptb, Equação (8.41)), obtemos 


z 1 T- 1 
K=1 . 
TA qr OTE 


n=1 


Agora citando a Equação (8.41), obtemos 
K=8+ Aus 1) - py 3). (8.44d) 
Usando os valores de pt) da Tabela 6.1 de AMS-55 (veja referência em Leituras Adicionais), obtemos 
K = 0,91596559.... 


Compare esse cálculo da constante de Catalan com os cálculos do Capítulo 5, seja o somatório direto, seja uma 
modificação usando valores da função zeta de Riemann. E 


“Veja a Seção 5.9. Para z Æ 0, essa série pode ser usada para definir uma função zeta generalizada. 
“Table of the Gamma Function for Complex Arguments, Applied Mathematics Series nº. 34. Washington, DC: National Bureau of Standards 
(1954). 
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Exercícios 
8.2.1 Verifique que as duas formas seguintes da função digama, 
EE 3 E 
o p=. EO É 
e 
writ 
e z 4 r(r + z) W 
são iguais uma à outra (para x inteiro positivo). 
8.2.2 Mostre que (z + 1) tem a expansão de série 
yeri == A e 
n=2 
8.2.3 Para uma expansão de série de potências de In(z!), AMS-55 (veja referência em Leituras 
Adicionais) relaciona 
Ee n) — 1|2” 
In(2!) = = m(1 + 2) + 2(1 - 7) + XC (1 LaS 
n=2 4 
(a) Mostre que essa expressão está de acordo com a Equação (8.44b) para |z| < 1. 
(b) Qual é a faixa de convergência dessa nova expressão? 
8.2.4 Mostre que 
1 TZ + C(2n) » 
2i = és Ji 
2 (E —) > m’ i 
Sugestão: Experimente a Equação (8.32). 
8.2.5 Escreva uma definição de produto infinito de Weierstrass de In(z!). Sem diferenciar, mostre que 
isso leva diretamente à expansão de Maclaurin de In(z!), Equação (8.44b). 
8.2.6 Derive a relação de diferença para a função poligama 
| 
(m) = tr) m e E 
p™ (z+ 2) =4""(2+D)+(—1) GFI m = 0,1,2,.... 
8.2.7 Mostre que, se 
T(x + iy) = u+ iv, 
então, 
T(x — iy) = u — iv. 
Esse é um caso especial do princípio de reflexão de Schwarz, Seção 6.5. 
8.2.8 O símbolo de Pochhammer (a)n é definido como 
(a)n =ala+1)---(a+n- 1), (a)o=1 
(para n inteiro). 
(a) Expresse (a), em termos de fatoriais. 
(b) Ache (d/da)(a), em termos de (a), e funções digama. 
d 
Resposta: ta (Dn = (a)n [Yla +n) — (a). 
(c) Mostre que 
(a)n = (a + m)p : (a)n- 
8.2.9 Verifique os seguintes valores especiais da forma 1) das funções digama e poligama: 


y) =-  D)=62), yP) = 263). 


ELSEVIER 
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8.2.10 


8.2.11 


8.2.12 


8.2.13 


8.2.14 


8.2.15 


8.2.16 


8.2.17 


8.2.18 


8.2.19 


8.2.20 


Derive a relação de recorrência da função poligama 
va + 2) = Por D mf MA m=0,1,2,.... 


Verifique 


(a) de ““lurdr = —y. 


(b) [a e"mnrdr=1-—9 
0 


(o f E, re" nr dr, n=1,2,3,... 
0 0 


Sugestão: Essas expressões podem ser verificadas por integração por partes três partes, ou 
diferenciando a forma integral de n! em relação a n. 


As funções de onda relativistas de Dirac para o hidrogênio envolvem fatores como [2(1 —a? Z2)!/2]! 
em que a, a constante de estrutura fina, é y$; e Z é o número atômico. Expanda [2(1 — q2Z2)1/2]! 
em uma série de potências de a? Z2. 


1 


A descrição da mecânica quântica de uma partícula em um campo de Coulomb requer que se 
conheça a fase da função fatorial complexa. Determine a fase de (1 + ib)! para b pequeno. 


A energia total irradiada por um corpo negro é dada por 


— 8mktT! T x y 
“= BR 0 E 


Mostre que a integral nessa expressão é igual a 3!((4). [6(4) = 74/90 = 1,0823...] O resultado 
final é a lei de Stefan-Boltzmann. 


Como generalização do resultado no Exercício 8.2.14, mostre que 


al ze = s!¢(s+1),  R(s) >0. 
0 


et — 


A densidade de energia do neutrino (distribuição de Fermi) na história remota do universo é dada 
por 


47 / r3 d 
= H 
Pv = | o explx/kT)+1 


Mostre que 


Prove que 


a ze = s!(1—27°)¢(s +1),  R(s) >0. 
0 


Os Exercícios 8.2.15 e 8.2.17 na verdade constituem as transformadas integrais de Mellin (compare 
com a Seção 15.1). 


Prove que 
(n) i les) tre 
VM (e) = (17+ / dt  R(@)>0. 
o 1-e7 
a 
Usando funções digama e poligama, some as séries (a) 2 ai (b) 2 T 


Nota: Você pode usar o Exercício 8.2.6 para calcular as funções digama necessárias. 


Mostre que 


2 (n+a(n+b) EP + (La), 


n=1 
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em que a Æ b e nem a nem b são um inteiro negativo. Tem um certo interesse comparar esse 
somatório com a integral correspondente, 


E ESTO = ——{m(1 +) — ln(1 +a)}. 


A relação entre y(x) e In z é explicitada na Equação (8.51) na seção seguinte. 


8.2.21 Verifique a representação de integral de contorno de C(s), 


yo Rim 
TE d dz. 


e7- 1 


O contorno C é o mesmo da Equação (8.35). Os pontos z = +2nri, n = 1,2,3,..., são todos 
excluídos. 

8.2.22 Mostre que ¢(s) é analítica em todo o plano complexo finito, exceto em s = 1, em que ela tem um 
pólo simples com um resíduo de +1. 
Sugestão: A representação de integral de contorno será útil. 


8.2.23 Usando a capacidade de variável complexa da linguagem FORTRAN, calcule R(1-+%b)!, S(1+ib)!, 
(1 + ib)!| e fase (1 + ib)! para b = 0, 0(0, 1)1, 0. Plote a fase de (1 + ib)! versus b. 
Sugestão: O Exercício 8.2.3 oferece uma abordagem conveniente. Você precisará calcular ¢(n). 


8.3 Série de Stirling 


Para cálculo de ln(z!) para z muito grande (mecânica estatística) e para cálculos numéricos em valores não-inteiros 
de z, uma expansão de série de ln(z!) em potências negativas de z é desejável. Talvez o modo mais elegante 
de derivar essa expansão seja pelo método das inclinações mais acentuadas (Seção 7.3). O método seguinte, 
que começa com uma fórmula de integração numérica, não requer que se conheça a integração de contorno e 
é particularmente direto. 


Derivação a Partir da Fórmula de Integração de Euler-Maclaurin 
A fórmula de Euler-Maclaurin para avaliar uma integral definida é 


f E E S O ++ Dr(a) 


=H rO =a (mn) — O] =, (8.45) 
na qual os bən estão relacionados com os números de Bernoulli Bən (compare com a Seção 5.9) por 
(2n)!bon = Bən, (8.46) 
Bo = 1, Be = > 
Bo = |, Bs =-ġ, (8.47) 
B, = — 5 Bio = o e assim por diante. 
Aplicando a Equação (8.45) à integral definida 
Rad 1 
/ SE (8.48) 
o +r? z 


(para z que não esteja sobre o eixo real negativo), obtemos 


aan a e (8.49) 


SÉ obtida por repetidas integrações por partes, Seção 5.9. 
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Essa é a razão para usar a Equação (8.48). A avaliação de Euler-Maclaurin resulta em pD(z + 1), que é 
d mnT(z + 1)/dz?. 
Usando a Equação (8.46) e resolvendo para pt) (z + 1), temos 


d 1 1 B B 
a) Ha ie 1,22 Saes da 
a cu FRIA ção Z 222 23 i 25 a 
1 1 2 Ban 
nont h mr fan 
n=1 


Uma vez que os números de Bernoulli têm forte divergência, essa série não converge. E uma série semiconvergente, 
ou assintótica, útil se retivermos um número suficientemente pequeno de termos (compare com a Seção 5.10). 
Integrando uma vez, obtemos a função digama 


1 B Bı 
1)= Cı +lnz+ 
o oa 2z 2z2 4z4 
1 Sa Bo 
Grato nar (8.51) 


Integrando a Equação (8.51) em relação a z de z — 1 até z, e então deixando que z tenda ao infinito, podemos 
mostrar que €4, a constante de integração, desaparece. Isso nos dá uma segunda expressão para a função digama, 
que muitas vezes é mais útil do que a Equação (8.38) ou (8.44b). 


Série de Stirling 
A integral indefinida da função digama (Equação (8.51)) é 
1 Bə Bən 
Inr 1)= 1 pf === E 52 
Rea) c+ (2+3) PETRE ga TAT ane aa Po ae) 


na qual €% é uma outra constante de integração. Para fixar C2, achamos conveniente usar a fórmula de duplicação, 
ou de duplicação de Legendre, derivada na Seção 8.4, 


T(z + DI(2+ 1) =2-2201/20(22 41). (8.53) 


Isso pode ser provado diretamente quando z é um inteiro positivo escrevendo T'(2z + 1) como um produto de 
termos pares vezes um produto de termos ímpares e extraindo um fator de 2 de cada termo (Exercício 8.3.5). 
Substituindo a Equação (8.52) no logaritmo da fórmula de duplicação, constatamos que C2 é 


C2 = 4 n27, (8.54) 


resultando em 


1 1 i 1 
12z 3602) 126025 


1 1 
mPE+1)= 32r- (2+5) mz z+ (8.55) 


Essa é a série de Stirling, uma expansão assintótica. O valor absoluto do erro é menor do que o valor absoluto do 
primeiro termo omitido. 

As constantes de integração C1 e Co também podem ser avaliadas por comparação com o primeiro termo da 
expansão em série obtido pelo método da “inclinação mais acentuada”, o que é executado na Seção 7.3. 

Para ajudar a ilustrar a notável precisão da série de Stirling para T (s + 1), a razão entre o primeiro termo da 
aproximação de Stirling e T (s + 1) é apresentada no gráfico da Figura 8.5. Uma tabulação dá a razão entre o 
primeiro termo na expansão e T'(s + 1) e a razão entre os dois primeiros termos na expansão e I (s + 1) (Tabela 
8.1). A derivação dessas formas é o Exercício 8.3.1. 


Exercícios 
8.3.1 Reescreva a série de Stirling para dar T(z + 1) em vez de lIn T(z + 1) 
1 1 139 
Resposta: T(z + 1) = 272º+1/2e-=[ 14 "P 
SSpS AETS Ape iE D 28822 518407 * 
8.3.2 Use a fórmula de Stirling para estimar 52!, o número de possíveis rearranjos de cartas em um baralho 


convencional. 
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1,02 
1,00 me e o 
e VIn sºt12 es (1 e 3) É 0,839% baixo 
” r(s+1) 
98 | 
0,97 | 
Fr g5+1/2 es 
96 T(s+1) 
,95 
94 
0,93 
PAA Ir E 
Figura 8.5: Precisão da fórmula de Stirling. 
Tabela 8.1 
1 1 1 
92 s+1/2,—s 92 s+1/2 o—8[1 Ea 
é Gs E O a SO SS os 
1 0,92213 0,99898 
2 0,95950 0,99949 
3 0,97270 0,99972 
4 0,97942 0,99983 
5 0,98349 0,99988 
6 0,98621 0,99992 
7 0,98817 0,99994 
8 0,98964 0,99995 
9 0,99078 0,99996 
10 0,99170 0,99998 
8.3.3 Integrando a Equação (8.51) de z — 1 a z, e então deixando que z — oo, avalie a constante C4 na 
série assintótica para a função digama (2). 
8.3.4 Mostre que a constante C na fórmula de Stirling é igual a 5 In 27 usando o logaritmo da fórmula 
de duplicação. 
8.3.5 Por expansão direta, verifique a fórmula de duplicação para z = n + > sendo n um inteiro. 
8.3.6 Sem usar a série de Stirling, mostre que 
n-+1 n 
(a) In(n!) < / Ina dz, (b) In(n!) > / Ina dz; n é um inteiro > 2. 
1 1 
Observe que a média aritmética dessas duas integrais dá uma boa aproximação para a série de 
Stirling. 
8.3.7 Teste para convergência 
E p= 4)!]? 2p+1 e (2p— DH2p + 1)! 
DE 2) | e esa (2p — 1)!!(2p + 1)!! 
E p! 2p +2 = (2p)!!(2p+2)!! 
Esta série surge em uma tentativa de descrever o campo magnético criado por um circuito de 
corrente e por ele circundado. 
8.3.8 Mostre que 
+a)! 
lim q*—º (za) zi 
T—00 (x fn b)! 
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8.3.9 Mostre que 


8.3.10 Calcule o coeficiente binomial (a até cinco algarismos significativos para n = 10, 20 e 30. 
1 


> 


(a) a uma aproximação da série de Stirling através de termos em n” 
(b) a um cálculo de precisão dupla. 


Resposta: (10) = 1,84756 x 105, (59) = 1,37846 x 101, 


(50) = 1,18264 x 10”. 

8.3.11 Escreva um programa (ou subprograma) para calcular logįo(x!) diretamente da série de Stirling. 
Admita que x > 10. (Valores menores poderiam ser calculados pela relação de recorrência fatorial.) 

Tabule logyo(x!) versus x para x = 10(10)300. Verifique seus resultados por comparação com 


AMS-55 (veja essa referência em Leituras Adicionais) ou por multiplicação direta (para n = 10, 
20 e 30). 


Valor de verificação. log,9(100!) = 157,97. 
8.3.12 Usando a capacidade de aritmética complexa da linguagem FORTRAN, escreva uma sub-rotina 
para calcular ln(z!) para z complexo com base na série de Stirling. Inclua um teste e uma mensagem 
de erro adequada se z estiver muito próximo de um inteiro real negativo. Verifique sua sub-rotina 
comparando com cálculos alternativos para z real, z imaginário puro e z = 1+1b (Exercício 8.2.23). 

Valores de verificação.  |(10,5)!| = 0, 82618 
fase (10,5)! = —0, 24406. 


8.4 A Função Beta 


Usando a definição de integral (Equação (8.25)), escrevemos o produto de dois fatoriais como o produto de duas 
integrais. Para facilitar a mudança nas variáveis, tomamos as integrais sobre uma faixa finita: 


2 


min! = lim e “u” du | e “uv” dv, nom: (8.56a) 
a2=00 Jo 0 R(n) >-l. 
Substituindo u por x? e v por y?, obtemos 
min! = lim af ET gmt] do | e ynt dy. (8.56b) 
a—00 0 0 
Transformando para coordenadas polares, temos 
a A n/2 
min! = lim af i dr f cos?™ +1 Osen?” tt0 do 
a—00 0 0 
n/2 
=(mtn+ ne f cos?" t! Asen?” t19 do. (8.57) 
0 


Aqui, o elemento de área cartesiano, dx dy, foi substituído por rdr d0 (Figura 8.6). A última igualdade na 
equação (8.57) resulta do Exercício 8.1.11. 
A integral definida, juntamente com o fator 2, foi denominada função beta: 


T/2 
B(m +1l,n+ 1) = af cos?" +1 Asen?” t19 do 
0 


min! 


= mena En FIN (8.58a) 
Do mesmo modo, em termos da função gama, e observando sua simetria, 
Trp (q 
Bo, = PL (gp) = Bipa). (8.58) 
P(p+ q) 


A única razão para escolher m + 1 e n + 1, em vez de m e n, como argumentos de B é estar de acordo com a 
função beta convencional, histórica. 
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Figura 8.6: Transformação de coordenadas cartesianas para coordenadas polares. 


Integrais Definidas, Formas Alternativas 
A função beta é útil na avaliação de uma ampla variedade de integrais definidas. A substituição t = cos? 0 converte 
a Equação (8.58a) em” 


Duda eo U -sT rn d 8.59 
+ f + = = Rd es t m t . a 
a (m+n+1)! f sd) do 
Substituindo t por x2, obtemos 
min! i 2m+1 nn 


A substituição t = u/(1 + u) na Equação (8.59a) resulta em mais uma forma útil, 


min! F u™ 
sis — d i M 
(m+n+1)! ) (1 + ujm Tnt” em) 


A função beta como uma integral definida é útil para estabelecer representações integrais da função de Bessel 
(Exercício 11.1.18) e da função hipergeométrica (Exercício 13.4.10). 


Verificação da Relação ra /sen ra 
Se considerarmos m = a, n = —a, —1 < a < 1, então 


f — E al(—a)!. (8.61) 
o ( 
Por integração de contorno, podemos demonstrar que essa integral é igual a 7a/sen ma (Exercício 7.1.18), o que 


nos dá mais um outro método para obter a Equação (8.32). 


Derivação da Fórmula de Duplicação de Legendre 
A forma da Equação (8.58a) sugere que a função beta pode ser útil na derivação da fórmula de duplicação utilizada 
na seção precedente. Pela Equação (8.594) com m = n = z R(z) > —1, 


z!z! l 
Substituindo t = (1 + s)/2, temos 
FARA! E E 
an=] 1-3) d zi. 1— 8)" ds. 8.63 
(z+ 1)! nne) ds Eao (8.63) 


7O teorema da convolução da transformada de Laplace oferece uma derivação alternativa da Equação (8.58a); compare com o 
Exercício 15.11.2. 
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A última igualdade vale porque a integranda é par. Avaliando essa integral como uma função beta 
(Equação (8.59b)), obtemos 


ala! 22-1 255)! 
= Qtd 8.64 
(22 + 1)! (245)! 66) 
Rearranjando termos e recordando que (—5)! = n!/2, reduzimos essa equação a uma das formas da fórmula de 
duplicação de Legendre, 

zl(z + 4)! = 277r? (2z +1)! (8.65a) 

Dividindo por (z + 5), obtemos uma forma alternativa da fórmula de duplicação: 
z!(z — $)! = 277r"? (22)! (8.65b) 
Embora as integrais usadas nessa derivação sejam definidas somente por R(z) > —l1, os resultados 


(Equações (8.65a) e (8.65b)) são válidos para todos os pontos z regulares por continuação analítica. 
Usando a notação de fatorial duplo (Seção 8.1), podemos reescrever a Equação (8.65a) (com z = n, um inteiro) 
como 
(n 4)! = 7? (2n + 1)!!/2"A, (8.65c) 


Isso é muitas vezes conveniente para eliminar fatoriais de frações. 


Função Beta Incompleta 
Exatamente como há uma função gama incompleta (Seção 8.5), também há uma função beta incompleta, 


Bolpg) = f P1- HT! dt, 0<r<1,p>0,9>0 (if x = 1). (8.66) 
0 


É claro que Ba=1(p,q) se torna a função beta regular (completa), Equação (8.59a). Uma expansão de série de 
potências de Bx(p, q) é o tópico dos Exercícios 5.2.18 e 5.7.8. A relação com funções hipergeométricas aparece 
na Seção 13.4. 

A função beta incompleta aparece também na teoria da probabilidade no cálculo da probabilidade de no máximo 
k sucessos em n tentativas independentes.” 


Exercícios 
8.4.1 Derive a fórmula de duplicação para a função fatorial integrando (sen 20)2"+! = (2sen0 cos 0)2"+1 
(e usando a função beta). 


8.4.2 Verifique as seguintes identidades de função beta: 
(a) B(a,b) = B(a+1,6) + B(a,b+ 1), 


a+b 


(b) Blab) =, 


B(a,b + 1), 
b—1 
(c) B(a,b) = —— B(a + 1,b— 1), 
a 


(d) B(a,b)B(a + b,c) = B(b,c)B(a,b+ c). 
8.4.3 (a) Mostre que 


1 T2, n=0 
/ (1-2) Pr dr=} (2-1)! 
“q T=, n=1,2,3,... 
(2n + 2)! 
(b) Mostre que 
1 ) T, n=0 
p= 2\ 71/2 2n d = o 1 
f m ode OCS E 
(2n)!! 


8Se 2z for um inteiro negativo, obtemos o resultado válido, mas nada esclarecedor, oo = oo. 
?W. Feller, An Introduction to Probability Theory and Its Applications, 3%. ed. Nova York: Wiley (1968), Seção VI.10. 
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8.4.4 Mostre que 
In! 
2n+1_ MN = 
Teca Ge 2? 
(1 -T ) da = 
—1 (2n)!! 
o, n=0,1,2,... 
(2n + D! 
8.4.5 Avalie S (1 + 2)“(1 — x)? dx em termos da função beta. 
Resposta: 2º" + B(a + 1,b+1). 
8.4.6 Mostre, por meio da função beta, que 
7 d 
/ Z s ; O<a<l. 
+ (2-a)l-c(e-t) senta 
8.4.7 Mostre que a integral de Dirichlet 
Ig! B(p+1 1 
|| ru do dy = gas ABBA a ) 
(p+q+2)! p+q+2 
em que a faixa de integração é o triângulo limitado pelos eixos x e y e pela reta x + y = 1. 
8.4.8 Mostre que 
Edo ii — (x£? +y? +2xy cos 0) de du = 9 
f f £ TWT asen 6º 
Quais são os limites para 0? 
Sugestão: Considere coordenadas oblíguas xy. 
Resposta: =r < 0 < T. 
8.4.9 Avalie (usando a função beta) 
(a) , 
T 2 3/2 
/ P 
0 161(5)!] 
(b) 
T/2 n/2 yess 1 2 1 
J cos” 0 d0 = / sen”0 d0 = KE et 
0 0 2(n/2)! 
(n — 1)! ; 
——— para n ímpar, 
O nt! 
“rn D! 
2 CR para n par. 
8.4.10 Avalie S 1 — z4) 1/2 dz como uma função beta. 
Pa 
Resposta: “Emi = 1,311028777. 
8.4.11 Dada 
IMZ) E SN W9 cos(zcos0) dð, Rv) >-—ł 
v(z) = —; m | > sen^” 0 cos(z cos ; v) > =z 
nH2(y — 5)! 2 0 2 
mostre, com a ajuda de funções beta, que essa expressão se reduz à série de Bessel 
oo 1 3 2s+v 
Jy = 1 3 , 
(2) D ) si(s +v)! G) 
s=0 
identificando o J, inicial como uma representação integral da função de Bessel, J, (Seção 11.1). 
8.4.12 Dada a função de Legendre associada 


P? (x) = (2m — Du( T E 


Seção 12.5, mostre que 
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(a) i [PX (x)| da = Ed e 
a m “9Im+4l 2i ar e at A) 
A ja 2 dz 
(b) Esto] i 5=2"(2m=1)!, m = 1,2,3,... 
=i — T 


8.4.13 


8.4.14 


8.4.15 


8.4.16 


8.4.17 


8.4.18 


8.4.19 


Mostre que 


a -1/2 (25)! 
(a) 1 zti (1 — gz?) = 354 DP 


1 — Dig 
(b) p x? (1 — z?)1 dr = T ma 
0 2(p+q+ 5)! 
Uma partícula de massa m se movimentando em um potencial simétrico que é bem descrito por 
V(x) = Alz|” tem uma energia total im(dx/dt)? + V(x) = E. Resolvendo para da /dt e 
integrando, constatamos que o período de movimento é 


r= avam [ gi 
0 


E Ar)? 
em que Tmáx é um ponto crítico clássico dado por AT háx = E. Mostre que 


2 Parm/EN” TA/n) 
TE : 
n ENA P(1/n + 5) 
Com referência ao Exercício 8.4.14, 


(a) Determine o limite quando n — oo de 


VE (a) rare 


(b) Ache lim 7 pelo comportamento da integranda (E — Ar") 42. 


(c) Investigue o comportamento do sistema físico (poço de potencial) quando n — co. Obtenha o 
período por inspeção desse sistema físico limitador. 


eo hº 1 1 8- 
p SU gy HS P 2), —I<a< 8. 
o cosh gz 2 2 2 


Mostre que 


Sugestão: Faça senh’z = u. 
A distribuição beta da teoria da probabilidade tem uma densidade de probabilidade 


_ El O) am E 
Ho = Eee aj, 


com « restrito ao intervalo (0,1). Mostre que 


(a) (x) (média) = 


att 
a+ 86 
(b) o? (variância) = (12) — (x)? = 


ap 
(a+ B2(a +B+1). 


Por 
E Jo sen?"0 do e 


MRSS jr sentr+Hig dð 


derive a fórmula de Wallis para 7: 


m 22 4.4 6-6 
2a TES 35 ET 
Tabule a função beta B(p, q) para q = 1, 0(0, 1)2, 0 independentemente. 
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Valor de verificação. B(1,3,1,7) = 0, 40774. 
8.4.20 (a) Escreva uma sub-rotina para calcular a função beta incompleta B,(p,q). Para 0,5 < x < 1, 
você verá que é conveniente usar a relação 


Ba(p,q) = B(p,q) — Br-a(g,p). 


(b) Tabule Bl, 5). Faça uma verificação aleatória de seus resultados usando a quadratura de 
Gauss-Legendre. 


8.5 Funções Gama Incompletas e Funções Relacionadas 


Generalizando a definição de Euler da função gama (Equação (8.5)), definimos as funções gama incompletas pelas 
integrais de limite variável 


yla, £) = | e~t! dt, R(a) > 0 
0 


T(a, x) = J emede, (8.67) 
É claro que as duas funções são relacionadas porque 
yla, x£) +T(a, x) =T (a). (8.68) 


Optar pelo emprego de y(a, x) ou T (a, x) é apenas uma questão de conveniência. Se o parâmetro a for um inteiro 
positivo, a Equação (8.67) pode ser integrada completamente para dar como resultado 


=) a 
y(n,a) =(n— 1)! € — e? 3 z) 
, A (8.69) 
T(n, x) (nn S n=1,2, 


Para a não-inteiro, são desenvolvidas uma expansão de série de potências de y(a, x) para x pequeno e uma 
expansão assintótica de T (a, x) (denotada como I(x, p)), no Exercício 5.7.7 e na Seção 5.10: 


Y(a, 2) = 2º res > |z| ~ 1 (x pequeno), 
n=0 
— mal ,—s q (a E 1)! . 1 
T(a, x) =r e > (a-1-n)! qn (8.70) 
a-1,—x — n (n E a)! 1 
= aee Ss (—1) a A > 1 (x grande). (8.71) 
n=0 é 


Essas funções gama incompletas também podem ser expressas em termos bastante elegantes de funções 
hipergeométricas confluentes (compare com a Seção 13.5). 


Integral Exponencial 

Embora seja pequena a fregiência com que a função gama incompleta T (a, x) em sua forma geral (Equação (8.67)) 
é encontrada em problemas físicos, um caso especial é bastante comum e muito útil. Definimos a integral 
exponencial por!º 


Ei(-z) = i are Ei(a). (8.72) 


(Veja Figura 8.7.) Aqui é preciso cautela, porque a integral na Equação (8.71) diverge logaritmicamente à 
medida que x — 0. Para obter uma expansão de série para x pequeno, começamos de 


10A aparição dos dois sinais de menos em — Ei(—x:) é uma monstruosidade histórica. AMS-55, Capítulo 5, denota essa integral por E1 (x). 
Veja referência em Leituras Adicionais. 
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1 1 L 1 | | I 1 >x 
02 04 06 08 10 12 14 16 


Figura 8.7: A integral exponencial, E1 (x) = —Ei(— x). 


Ei(x) = T(0,4) = lim [T (a) — (a, £)]. (8.73) 


a—0 


Podemos subdividir o termo divergente na expansão de série para y(a, £), 


. [ar (a) -— z’ vir 
E =1 ; 8.74 
(£) im) a | > PEN (8.74) 
Usando a regra de l’ Hôpital (Exercício 5.6.8) e 
d d d In(a! 
gwiT = u” = das ( ) — alla + 1), (8.75) 


e então a Equação (8.40)!!, obtemos a série de convergência rápida 


Ei(a)=-y-lng 2 RR (8.76) 
Uma expansão assintótica Ei (x) = eli — 5 +---| para x — oo é desenvolvida na Seção 5.10. 


Outras formas especiais relacionadas com a integral exponencial são a integral do seno, a integral do co-seno 
(Figura 8.8) e a integral logarítmica, definidas por!? 


Figura 8.8: Integrais de seno e co-seno. 


Udrº/da = 2º ln z. 
“Uma outra integral de seno é dada por Si(x) = si(x) + 7/2. 
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Ci(z) = — o dt (8.77) 


para seus ramos principais, sendo que, por convenção, o corte de ramificação escolhido é ao longo do eixo real 
negativo a partir do ponto de ramificação em zero. Transformando de argumento real para argumento imaginário, 
podemos mostrar que 


1 1 
si(£) = z; LEilia) — Ei(—ix)] = B |E (ix) — Eı(—ix)], (8.78) 
i i 
ao passo que 
; Lo. Rar 1 ; ; T 
Ci(x) = 5 [Ei(ia:) + Ei(-ix)] = = [E (ix) + Eı(—ix)], |arg z| < 2 (8.79) 
Somando essas duas relações, obtemos 
Ei(ix) = Ci(x) + isi(x), (8.80) 


para mostrar que a relação entre essas integrais é exatamente análoga à relação entre e'”, cos x, e sen x. Referindo- 
nos às Equações (8.71) e (8.78), vemos que Ci(x) está de acordo com as definições de AMS-55 (veja referência 
em Leituras Adicionais). Em termos de Æ}, 


Ei(ia) = —Ci(x) + isi(a). 


Expansões assintóticas de Ci(x) e si(x) são desenvolvidas na Seção 5.10. Expansões de séries de potências em 
torno da origem para Ci(x), si(x) e li(x) podem ser obtidas a partir das expansões para a integral exponencial, 
E(x), ou por integração direta, Exercício 8.5.10. As integrais de exponencial, de seno e de co-seno são tabuladas 
em AMS-55, Capítulo 5 (veja referência em Leituras Adicionais) e também podem ser acessadas por softwares 
simbólicos como Matemática, Mace, Mathcad e Reduce. 


Integrais de Erro 
As integrais de erro 


2 a = 2 K = 
erfz = — e" dt, erfcz= 1 — erfz = — et dt (8.81a) 
VT 0 VT z 


(normalizadas de modo que erf oo = 1) são introduzidas no Exercício 5.10.4 (Figura 8.9). Ali são desenvolvidas 
formas assintóticas. Pela forma geral dos integrandos e Equação (8.6), esperamos que erfz e erfcz possam ser 
escritas como funções gama incompletas com a a = >. As relações são 


erf x 


Figura 8.9: Função de erro, erf x. 


erfz = do, z2?),  erfcz = TE 2). (8.81b) 


A expansão de série de potências de erf z resulta diretamente da Equação (8.70). 
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Exercícios 
8.5.1 Mostre que 


Y(a, £) = ey (a — 1)! atn 


A (a + n)! 


(a) Integrando repetidamente por partes. 
(b) Demonstre essa relação transformando-a na Equação (8.70). 


8.5.2 Mostre que 
(a) 


dam 
a [e”y(a, x)| = rena - m, x). 


8.5.3 Mostre que y(a, x) e T (a, x) satisfazem as relações de recorrência 


(b) 


(a) yla + 1,7) E ata, x) -re ?, 
(b) T(a+1,x) = ar (a, £) + re~”. 


8.5.4 O potencial produzido por um elétron de hidrogênio 1S (Exercício 12.8.6) é dado por 


V(r) = P i Lyg, 2r) +T(2, 21) 


(a) Parar < 1, mostre que 


q 2.2 
= 1 — — ... A 
tr ÅTE0a0 i se w } 


q 1 


ATEoao r` 


(b) Para r >> 1, mostre que 


V(r) 


Aqui, r é expresso em unidades de ao, o raio de Bohr. 
Nota: Para cálculo em valores intermediários de r, as Equações (8.69) são convenientes. 


8.5.5 Constatamos que o potencial de um elétron de hidrogênio 2P é (Exercício 12.8.7) 


o EENE. {h6 r)+T(4, n} 


z ÅTE0 l 24ao (r 


l q fl E 
í T(2, r) p Po(cos 6). 
Are TRET ,r)+r'T( D (cos 0) 


Aqui, r é expresso em unidades de ao, o raio de Bohr. P>(cos6) é um polinômio de Legendre 
(Seção 12.1). 


(a) Parar < 1, mostre que 


1 1 1 
V(r) e E pr Poso) ++: |. 


(b) Para r >> 1, mostre que 


n e El E Palcos) +} 


= 4reo aor 
8.5.6 Prove que a integral exponencial tem a expansão 
O e-t o9 (—1)”x” 
dt = l 
Aor 


em que y é a constante de Euler-Mascheroni. 


402 
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8.5.7 


8.5.9 
8.5.10 


8.5.11 


8.5.12 


8.5.13 


8.5.14 


Mostre que E1(z) pode ser escrita como 


(0,0) et 
E = e7* — dt. 
RO fia f Es: 


Mostre também que devemos impor a condição | arg z| < 7/2. 


œ —at 
En(x) = / © tt. 


tr 


A função 


está relacionada à integral exponencial (Equação (8.71)) por uma simples troca de variável. Mostre 
que E, (ax) satisfaz a relação de recorrência 


1 x 
En = Że? too), =1,2,3,... 
ale) = e- Eple), n 
Com E, (1) como definida no Exercício 8.5.8, mostre que En (0) = 1/(n — 1), n > 1. 


Desenvolva as seguintes expansões de séries de potências: 
. x oo (— 
a + rr EnF 


(b) Ci(ax) Saru oro 


Uma análise de uma antena linear alimentada no ponto central leva à expressão 


“1 — cost 
/ ease 
0 t 


Mostre que essa expressão é igual a y + ln x — Ci(a). 


Usando a relação 
Na) = y(a, £) +T (a, x), 


mostre que, se y(a, x) satisfaz as relações do Exercício 8.5.2, então T (a, x) deve satisfazer as 

mesmas relações. 

(a) Escreva uma sub-rotina para calcular as funções gama incompletas y(n, x) e T(n, x) para n 
inteiro positivo. Faça uma verificação aleatória de I (n, x) por quadraturas de Gauss-Laguerre. 

(b) Tabule y(n, x) e T(n, x) para x = 0,0(0,1)1,0en = 1,2,3. 

Calcule o potencial produzido por um elétron de hidrogênio 15 (Exercício 8.5.4) (Figura 8.10). 

Tabule V (r)/(q/4T£oa0) para x = 0,0(0, 1)4, 0. Verifique seus cálculos parar < leparar > 1 

pelo cálculo das formas limitadoras dadas no Exercício 8.5.4. 


Potencial de uma carga pontual 


1/r 


Potencial de 
| uma carga 
distribuída 


Figura 8.10: Potencial de carga distribuída produzido por um elétron de hidrogênio 15, Exercício 8.5.14. 
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8.5.15 | Usando as Equações (5.182) e (8.75), calcule a integral exponencial E; (x) para 
(a) x = 0,2(0,2)1,0, (b) x = 6,0(2,0)10,0. 


Programe seu próprio cálculo mas verifique cada valor usando uma sub-rotina de biblioteca, caso 
esteja disponível. Além disso, verifique seus cálculos em cada ponto por uma quadratura de Gauss- 
Laguerre. 


Você constatará que a série de potências converge rapidamente e dá alta precisão para x pequeno. 
A série assintótica, para x = 10, dá uma precisão relativamente ruim. 


Valores de verificação. F1(1,0) = 0,219384 
E (10,0) = 4,15697 x 1078. 
8.5.16 As duas expressões para Fi (ax), 1) Equação ((5.182), uma série assintótica e (2) Equação (8.75), 
uma série convergente de potências, fornecem um meio para calcular a constante y de Euler- 
Mascheroni com alta precisão. Usando precisão dupla, calcule y pela Equação (8.75), com E(x) 
avaliada pela equação (5.182). 
Sugestão: Como uma opção conveniente, considere x na faixa de 10 a 20. (O x escolhido 
determinará um limite para a precisão de seu resultado.) Para minimizar erros na série alternante da 
Equação (8.75), acumule os termos positivos e negativos separadamente. 


Resposta: Para x = 10 e “precisão dupla” y = 0, 57721566. 


Leituras Adicionais 

Abramowitz, M., e I. A. Stegun, (Eds.), Handbook of Mathematical Functions with Formulas, Graphs, and 
Mathematical Tables (AMS-55). Washington, DC: National Bureau of Standards (1972), reimpresso, Dover 
(1974). Contém uma profusão de informações sobre funções gama, funções gama incompletas, integrais 
exponenciais, funções de erro e funções relacionadas, Capítulos 4 a 6. 

Artin, E., The Gamma Function (tradução de M. Butler). Nova York: Holt, Rinehart e Winston (1964). Demonstra 
que, se uma função f(x) for suave (log convexa) e igual a (n — 1)! quando x = n = inteiro, ela é a função 
gama. 

Davis, H. T., Tables of the Higher Mathematical Functions. Bloomington, IN: Principia Press (1933). O volume I 
contém informação extensiva sobre a função gama e as funções poligama. 

Gradshteyn, I. S., e I. M. Ryzhik, Table of Integrals, Series, and Products. Nova York: Academic Press (1980). 

Luke, Y. L., The Special Functions and Their Approximations, vol. 1. Nova York: Academic Press (1969). 

Luke, Y. L., Mathematical Functions and Their Approximations. Nova York: Academic Press (1975). É um 
suplemento atualizado de Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical 
Tables (AMS-55). O Capítulo 1 trata da função gama. O Capítulo 4 trata da função gama incompleta e de uma 
grande quantidade de funções relacionadas. 
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Equações Diferenciais 


9.1 Equações Diferenciais Parciais 


Introdução 
Em Física, saber qual é a força em uma equação de movimento usualmente leva a uma equação diferencial. Por isso, 
quase todas as numerosas partes avançadas da Física Teórica são formuladas em termos de equações diferenciais. 
Às vezes elas são equações diferenciais ordinárias de uma só variável (abreviadas para EDOs). Na maioria das 
vezes são equações diferenciais parciais (EDPs) de duas ou mais variáveis. 

Vamos lembrar que, no cálculo, a operação de considerar uma derivada ordinária ou parcial é uma operação 
linear (£),! 


dao) +by(o)) _ de | pd 


dx dx dx’ 


para EDOs que envolvem derivadas de uma única variável x e nenhuma potência quadrática, (di /dx)2, ou de 
ordens mais altas. De modo semelhante, para derivações parciais, 


Oaplx,y) +bylz,y)) q PMEs) P 2L) 
Ox g Ox Fo ` 


Em geral, 
Llap + by) = allp) + bL). 
Assim, EDOs e EDPs aparecem como equações de operador linear, 
Ly =F, (9.1) 


em que F é uma função (fonte) conhecida de uma variável (para EDOs) ou de mais variáveis (para EDPs), £ é uma 
combinação linear de derivadas e 1) é a função desconhecida ou solução. Qualquer combinação linear de soluções 
é novamente uma solução se F = 0; este é o princípio de superposição para EDPs homogêneas. 

Uma vez que a dinâmica de muitos sistemas físicos envolve apenas duas derivadas (por exemplo, aceleração 
na Mecânica Clássica e o operador de energia cinética, ~ W2, na Mecânica Quântica), equações diferenciais 
de segunda ordem ocorrem com muita fregiiência na Física. (As equações de Maxwell e Dirac são de primeira 
ordem, mas envolvem duas funções desconhecidas. A eliminação de uma dessas funções resulta em uma equação 
diferencial de segunda ordem para a outra (compare com a Seção 1.9.) 


Exemplos de EDPs 
Entre as EDPs encontradas com maior frequência estão as seguintes: 
1. Equação de Laplace, V? 1) = 0. 
Essa equação muito comum e muito importante ocorre em estudos de 

(a) fenômenos eletromagnéticos, incluindo eletrostática, dielétricos, correntes estáveis e magnetostática, 
(b) hidrodinâmica (escoamento irrotacional de fluido perfeito e ondas superficiais), 
(c) fluxo de calor, 
(d) gravitação. 


"Estamos especialmente interessados em operadores lineares porque na Mecânica Quântica as quantidades físicas são representadas por 
operadores lineares em um espaço de Hilbert, complexo, de número infinito de dimensões. 


404 


“livro” — 2007/8/1 — 15:06 — page 405 — #415 


ELSEVIER 9. EQUAÇÕES DIFERENCIAIS 405 


2. Equação de Poisson, V21) = —p/co. 
Em contraste com a equação homogênea de Laplace, a equação de Poisson é não-homogênea com um 
termo de fonte — p/£o. 
3. As equações de onda (Helmholtz) e as equações de difusão independentes de tempo, V? y + k?y = 0. 
Essas equações aparecem em fenômenos tão diversos como 
(a) ondas elásticas em sólidos, incluindo cordas, barras e membranas vibratórias, 
(b) som ou acústica, 
(c) ondas eletromagnéticas, 
(d) reatores nucleares. 
4. A equação de difusão dependente de tempo 


1 ð% 

a? Ot 

e as formas quadridimensionais correspondentes que envolvem o d'alembertiano, um análogo 
quadridimensional do laplaciano no espaço de Minkowski, 

1 92 


2 
W0,=0=5580V . 


V?yp = 


n 


. A equação de onda dependente de tempo, 021) = 0. 
6. A equação de potencial escalar, 021) = p/£o. 
Assim como a equação de Poisson, essa equação é não-homogênea com um termo de fonte p/£o. 
7. A equação de Klein-Gordon, 02) = —u?Y, e as equações vetoriais correspondentes, nas quais a função 
escalar 1) é substituída por uma função vetorial. Outras formas, mais complicadas, são comuns. 
8. A equação de onda de Schrödinger, 
G Vºp+V no” 
“2m ai ot 


h2 
-5 VY +V =E}, 
2m 


para o caso independente de tempo. 
9. As equações para ondas elásticas e fluidos viscosos e a equação da telegrafia. 
10. Equações diferenciais parciais acopladas de Maxwell para campos elétricos e magnéticos e as de Dirac para 
funções de onda relativistas de elétron. Para equações de Maxwell, veja a Introdução e também a Seção 1.9. 


Algumas técnicas gerais para resolver EDPs de segunda ordem são discutidas nesta seção. 

1. Separação de variáveis quando a EDP é subdividida em EDOs que são relacionadas por constantes comuns que 
aparecem como autovalores de operadores lineares, Ly = ly, usualmente de uma só variável. Esse método 
guarda uma relação muito próxima com simetrias da EDP e um grupo de transformações (veja a Seção 4.2). 
A equação de Helmholtz, exemplo 3 da lista, tem essa forma, em que o autovalor k? pode surgir pela separação 
do tempo t das variáveis espaciais. Da mesma forma, no exemplo 8 a energia E é o autovalor que surge pela 
separação de t de r na equação de Schrödinger. Examinamos isso no Capítulo 10 com mais detalhes. A Seção 
9.2 serve como introdução. EDOs podem ser atacadas pelo método de série de potências de Frobenius na Seção 
9.5. O método nem sempre funciona, mas, quando funciona, é o método mais simples. 

2. Conversão de uma EDP em uma equação integral usando funções de Green aplica-se a EDPs não-homogêneas, 
tais como os exemplos 2 e 6 dados acima. Uma introdução à técnica da função de Green é dada na Seção 9.7. 

3. Outros métodos analíticos, tais como a utilização de transformadas integrais, são desenvolvidos e aplicados no 
Capítulo 15. 

Ocasionalmente encontramos equações de ordens mais altas. Tanto na teoria do movimento lento de um fluido 
viscoso quanto na teoria de um corpo elástico, encontramos a equação 


(V?) y = 0. 


Felizmente, essas equações de ordens mais altas são relativamente raras e não serão discutidas aqui. 

Embora nem tão freqüentes e talvez nem tão importantes como as EDOs de segunda ordem, EDOs de primeira 
ordem aparecem na Física Teórica e às vezes são etapas intermediárias para EDOs de segunda ordem. As soluções 
de alguns tipos mais importantes de EDOs de primeira ordem são desenvolvidas na Seção 9.2. EDPs de primeira 
ordem sempre podem ser reduzidas a EDOs. Esse processo é direto, porém longo, e envolve uma procura de 
características que são apresentadas resumidamente no texto a seguir; para mais detalhes, referimo-nos à literatura. 
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Classes de EDPs e Características 
EDPs de segunda ordem formam três classes: (1) EDPs elípticas envolvem V? ou c 292 / t+ V? Gii) EDPs 
parabólicas, ad /ðt+ V?; (iii) EDPs hiperbólicas, 292 /08— V2. Esses operadores canônicos aparecem por 


uma troca de variáveis € = &(x,y), ņn = n(x,y) em um operador linear (para duas variáveis apenas, por 
simplicidade) 
o? o? 92 o (9) 
L= + 2b + m E rap 9.2 
“972 dxdy “By? ox Dy f Oa 


que pode ser reduzido para as formas canônicas (i), Gi), (iii) conforme o discriminante D = ac — b? > 0, = 0, ou 
< 0. Se &(x,y) for determinada pela EDP de primeira ordem, mas não-linear, 


EN? DEN / Ət EN? 

a( 2) +2(%) (5) +e(5:) =0, (9.3) 
então o coeficiente de 92/ ð? em L (isto é, Equação (9.3)) é zero. Se n for uma solução independente da 
mesma Equação (9.3), então o coeficiente de 02 /0n? também é zero. O operador remanescente, 02 /9£ôn, em 
L é característico do caso hiperbólico (iii) com D < 0 (a = 0 = clevaa D = —b? < 0), em que a forma 
quadrática de aà? + 2bA + c é fatorada e, portanto, a Equação (9.3) tem duas soluções independentes E(x, y), 
n(x, y). No caso elíptico (i) com D > 0, as duas soluções £, n são conjugadas complexas que, quando substituídas 
na Equação (9.2), removem a derivada mista de segunda ordem em vez dos outros termos de segunda ordem, 
resultando na forma canônica (i). No caso parabólico (ii) com D = 0, somente 0? /08 4 permanece em £, enquanto 
os coeficientes das outras derivadas de segunda ordem desaparecem. 

Se os coeficientes a, b, c em £ são funções das coordenadas, então essa classificação é apenas local; isto é, seu 
tipo pode mudar quando as coordenadas variam. 
Vamos ilustrar a física subjacente ao caso hiperbólico examinando a equação de onda, Equação (9.2) (em 1+1 


dimensões, por simplicidade) 
1 92 o? 
555 — o a 
co Or? 


Visto que a Equação (9.3) agora se torna 


(5) -ACE = (cm) (em) 
=] -í| 2] = c +c =0 
ot ox ot dx ) \ ðt ox 
e é fatorada, determinamos a solução de 9€/0t — cd£/dx = O. Esta é uma função arbitrária € = F(x + ct), e 
E = G(x — ct) resolve 9€/0t + cd£/dx = 0, o que é imediatamente verificado. Por superposição linear, uma 
solução geral da equação de onda é y = F(x + ct) + G(x — ct). Para funções periódicas F, G reconhecemos 
as retas x + ct e x — ct como as fases de ondas planas ou frentes de onda, em que nem todas as derivadas de 
segunda ordem de 7) na equação de onda são bem definidas. Os raios da óptica geométrica são normais a frentes 
de onda. Assim, as retas que são soluções da Equação (9.3) e recebem o nome de características ou às vezes 
bicaracterísticas (para EDPs de segunda ordem) correspondem, na literatura matemática, a frentes de onda da 
solução da óptica geométrica da equação de onda. 

Para o caso elíptico, vamos considerar a equação de Laplace, 


ERA a 
ðr? dy 


0, 


para um potencial 1) de duas variáveis. Aqui, a equação característica, 


DEN" pae? fae aeae DE 
(5) iá (a) E (o tiay) Or ay) TO 
tem soluções conjugadas complexas: é = F(x + iy) para d€/dx + i(0€/0y) = 0 e E = G(x — iy) para 
96/0x — i(Əð/Əðy) = 0. Portanto, uma solução geral da equação de Laplace é Yy = F(x + iy) + G(x — iy), 


bem como as partes real e imaginária de 1), que são denominadas funções harmônicas, enquanto as soluções 
polinomiais são denominadas polinômios harmônicos. 
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Em Mecânica Quântica, a forma de Wentzel-Kramers-Brillouin (WKB), 1) = exp(—1S/h), para a solução da 
equação de Schrödinger, uma EDP parabólica complexa, 


Po OW 
(57 +v)o=n5, 


leva à equação de Hamilton-Jacobi da Mecânica Clássica, 


os 

ot’ 
no limite de À — 0. A clássica ação § obedece à equação de Hamilton-Jacobi, que é a análoga da Equação (9.3) da 
equação de Schrödinger. Substituindo V y = —iy V S/ħ, dy/Ot = —iyb(0S/ôt)/h na equação de Schrödinger, 
descartando Y, o fator global que não desaparece, e tomando o limite da equação resultante, à medida que A — 0, 
obtemos, de fato, a Equação (9.4). 

Achar soluções de EDPs resolvendo para as características é uma das diversas técnicas gerais. Se o leitor quiser 
mais exemplos, consulte H. Bateman, Partial Differential Equations of Mathematical Physics, Nova York: Dover 
(1944); K. E. Gustafson, Partial Differential Equations and Hilbert Space Methods, 2% ed., Nova York: Wiley 
(1987), nova tiragem, Dover (1998). 

Para derivar e apreciar mais o método matemático por trás dessas soluções de EDPs hiperbólicas, parabólicas 
e elípticas, vamos reconsiderar a EDP (9.2) com coeficientes constantes e, a princípio, d = e = f = 0 por 
simplicidade. De acordo com a forma das soluções de frente de onda, buscamos uma solução y = F(E) da 
Equação (9.2) com uma função é = &(t, x) usando as variáveis t, z em vez de x, y. Então, as derivadas parciais se 
tornam 


1 2 Za 
z (VS +V = (9.4) 


3p d9EdF db - 0EdF Py PEdF (EN PF 
ðr ðr dé ðt Ot dt’ ðr? ðr? dé dx) dé?” 


op PE dF O OE DE d2F Py EdF (EN? PF 
Oxdt ðxðt dE  Əx ðt dE?’ Ət Ot dé ðt) de? 
usando a regra da cadeia da diferenciação. Quando é depende de x e t linearmente, essas derivadas parciais de 1) 
resultam em um único termo e, como conseqiiência, resolvem nossa EDP (9.2). Por E = ax + ft linear, obtemos 
oy 50 F oy dF 2a) dF 
=Q =Q = 
dx? des o Oxôdt de?” ot? de? 


e nossa EDP (9.2) se torna equivalente à análoga da Equação (9.3), 
d2F 
(aa + 2088b + B2c) Wi 0. (9.5) 
PF = 
de? — 
para a qual todas as derivadas de segunda ordem desaparecem. Por outro lado, por a2a +2a8b+ Be = 0, obtemos 
as razões 


Uma solução de O só leva à trivial Y = kız + kot + ks com k; constantes que é linear nas coordenadas e 


="[b+(P-a) | =rmo (9.6) 


como soluções da Equação (9.5) com ae * 0 em geral. As retas E, = x + rıt e é, = x + rat resolverão a EDP 
(9.2), com y(x,t) = F(£,) + G(6,) correspondendo à generalização de nossos exemplos precedentes de EDPs 
hiperbólica e elíptica. 


Para o caso parabólico, em que b? = ac, há somente uma razão da Equação (9.6), 3a = r = —b/c, e uma 
(solução, W(x,t) = F(x — bt/c). Para achar a segunda solução geral de nossa EDP (9.2), fazemos (solução 
experimental) o Ansatz (x,t) = Yo(x,t)- G(x — bt/c). Substituindo essa expressão na Equação (9.2), 
encontramos 

abo po | Sado 


2b = 
E VC nd E S 
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para po, uma vez que substituir F — G, G resolve a Equação (9.5) com d? G/ de? * 0 em geral. A solução Yo 
pode ser qualquer solução de nossa EDP (9.2), incluindo as triviais, como Yo = £ e Yo = t. Assim, obtemos a 
solução parabólica geral, 


dd r(e z te) E ento o(a = te), 


com Yo = x ou Yo = t, etc. 

Com o mesmo Ansatz achamos soluções de nossa EDP (9.2) com um termo de fonte, por exemplo, f # 0, mas, 
ainda d = e = 0 e a, b, c constantes. 

Em seguida determinamos as características, isto é, curvas as derivadas de segunda ordem das solução 1) não 
são bem definidas. Essas curvas são as frentes de onda ao longo das quais as soluções de nossa EDP hiperbólica 
(9.2) se propagam. Resolvemos nossa EDP com um termo de fonte f # 0 e condições de fronteira de Cauchy (veja 
a Tabela 9.1) adequadas para EDPs hiperbólicas, em que % e sua derivada parcial normal 9% /Ôn são especificadas 
sobre uma curva aberta. 


C: x= zr(s), t= t(s), 


sendo o parâmetro s o comprimento sobre C. Então, dr = (dx, dt) é tangente e ñ ds = (dt, —dx) é normal à curva 
C, e as derivadas de primeira ordem tangencial e normal são dadas pela regra da cadeia 


dp dr ðpde Əy dt 
g ds Əz ds | ðt dz’ 
db ~ pdt pde 
a a 


Por essas duas equações lineares, O /3t e OW /Ox podem ser determinadas sobre C, contanto que 


x 2 2 
d da 
H = ds ds 


Para as derivadas de segunda ordem usamos novamente a regra da cadeia 


dop dry dt O 


dade dedo Cas OUDU (9.7a) 
d õp drop dt 
do O RRI * do OB (9.76) 


Por nossa EDP (9.2) e Equações (9.7a,b), que são lineares nas derivadas de segunda ordem, elas não podem ser 
calculadas quando o determinante desaparece, isto é, 


a 2b c 7 ; 
dt dx dt da 
da dt = = 
d g 0 (F) dm ER eF) 0. (9.8) 
0 dx dt 
ds ds 


Pela Equação (9.8), que define as características, constatamos que a razão tangente da /dt obedece a 


daN? da 
($) gs Õ, 


então, 


de 1 1/2 

— = ` [b (bo = ; 9.9 
de pa (e - a)” 09) 
Para os exemplos anteriores de equação de onda hiperbólica (e de potencial elíptico), b = 0 e a, c são constantes, 
portanto as soluções €; = x + tr; da Equação (9.6) coincidem com as características da Equação (9.9). 


“livro” — 2007/81 — 15:06 — page 409 — #419 


9. EQUAÇÕES DIFERENCIAIS 409 


ELSEVIER 


EDPs Não-Lineares 


EDOs e EDPs não-lineares são uma área importante e de rápido crescimento. Antes já encontramos a mais simples 
das equações lineares de onda, 


como a EDP de primeira ordem das frentes de onda da equação de onda. A mais simples das equações de onda 


não-lineares, 
ay oy o 


DE + c(1h) Ir 


resulta se a velocidade local de propagação, c, não é constante, mas depende da onda 1. Quando uma equação não- 
linear tem uma solução da forma (x, t) = A cos(kx — wt), em que w(k) varia com k, de modo que w” (k) # 0, 
então ela é denominada dispersiva. Talvez a mais conhecida equação dispersiva não-linear seja a equação de 
Korteweg-de Vries 


0, (9.10) 


dp 3y v 
a a (9.11) 


que modela a propagação sem perda de ondas de águas rasas e outros fenômenos. Ela é muito conhecida por 
suas soluções sóliton. Um sóliton é uma onda em movimento que tem a propriedade de persistir durante uma 
interação com um outro sóliton: após passarem uma pela outra, elas emergem com a mesma forma e com a mesma 
velocidade e adquirem não mais do que uma mudança de fase. Seja Y(E = a — ct) essa onda em movimento. 
Quando substituída na Equação (9.11), o resultado é a EDO não-linear 


d dê 
(b- SE + E =0, (9.12) 
que pode ser integrada para dar 
d? i 
Tt- (9.13) 


Não há nenhuma constante de integração aditiva na Equação (9.13) para garantir que d?yYy/dE? — 0 com y — 0 
para é grande, portanto 1) está localizada na característica £ = 0 ou x = ct. Multiplicando a Equação (9.13) por 
dy / dé e integrando novamente, temos como resultado 


dy? É 
(=) E a (9.14) 


em que di) /dé — O para é grande. Considerando a raiz da Equação (9.14) e integrando mais uma vez, temos como 


resultado a solução sóliton 
3c 


EE g—cet) * 
cosh” (ct) 
Alguns tópicos não-lineares, por exemplo, a equação logística e a instalação do caos, são novamente abordadas no 
Capítulo 18. Se o leitor quiser mais detalhes e literatura, consulte J. Guckenheimer, P. Holmes e F. John, Nonlinear 


Oscillations, Dynamical Systems and Bifurcations of Vector Fields, edição revista, Nova York: Springer-Verlag 
(1990). 


bla — ct) = (9.15) 


Condições de Contorno 

Em geral, quando conhecemos um sistema físico em algum ponto do tempo e a lei que governa o processo físico, 

então conseguimos prever o desenvolvimento subsegiiente. Tais valores iniciais são as condições de contorno mais 

comuns associadas com EDOs e EDPs. Achar soluções que se ajustam a pontos, curvas ou superfícies dadas 

corresponde a problemas de valor de contorno. Habitualmente as soluções devem satisfazer certas condições de 

contorno impostas (por exemplo, assintóticas). Essas condições podem assumir três formas: 

1. Condições de contorno de Cauchy. O valor de uma função e derivada normal especificado sobre o contorno. 
Em eletrostática isso significaria «o, o potencial, e E,,, a componente normal do campo elétrico. 

2. Condições de contorno de Dirichlet. O valor de uma função especificado sobre o contorno. 

3. Condições de contorno de Neumann. A derivada normal (gradiente normal) de uma função especificada sobre 
o contorno. No caso da eletrostática, isso seria E, e, portanto, o, a densidade superficial de carga. 
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Um resumo da relação entre esses três tipos de condições de contorno e os três tipos de equações parciais 
diferenciais bidimensionais é dado na Tabela 9.1. Se o leitor se interessar por discussões mais extensas dessas 
equações diferenciais parciais, pode consultar Morse e Feshbach, Capítulo 6 (veja Leituras Adicionais). 

Partes da Tabela 9.1 são simplesmente uma questão de manter consistência interna ou de bom senso. Por 
exemplo, para a equação de Poisson com uma superfície fechada, as condições de Dirichlet levam a uma solução 
única, estável. As condições de Neumann, independentes das condições de Dirichlet, levam, da mesma forma, a 
uma solução única, estável, independente da solução de Dirichlet. Por conseguinte, as condições de contorno de 
Cauchy (isto é, Dirichlet mais Neumann) poderiam levar a uma inconsistência. 


Tabela 9.1 
Condições de contorno Tipo de equação diferencial parcial 
Condições Elíptica Hiperbólica Parabólica 
Laplace, Poisson Equação de onda em Equação de difusão 
em (x,y) (x,t) em (x,t) 
Cauchy 
Superfície aberta Resultados não-físicos Solução única, estável Muito restritiva 
(instabilidade) 
Superfície fechada Muito restritiva Muito restritiva Muito restritiva 
Dirichlet 
Superfície aberta Insuficiente Insuficiente Solução única, estável, 
em uma só direção 
Superfície fechada Solução única, estável Solução não-única Muito restritiva 
Neumann 
Superfície aberta Insuficiente Insuficiente Solução única, estável 
em uma só direção 
Superfície fechada Solução única, estável Solução não-única Muito restritiva 


O termo condições de contorno inclui como um caso especial o conceito de condições iniciais. Por exemplo, 
especificar a posição inicial xo e a velocidade inicial vo em algum problema de dinâmica corresponderia às 
condições de contorno de Cauchy. A única diferença na utilização presente de condições de contorno nesses 
problemas unidimensionais é que vamos aplicar as condições em ambas as extremidades do intervalo permitido 
da variável. 


9.2 Equações Diferenciais de Primeira Ordem 


A Física envolve algumas equações diferenciais de primeira ordem. Para não deixar nada de fora (e fazer uma 
revisão), é bom abordar esse assunto brevemente. Aqui, consideramos equações diferenciais da forma geral 


P(x,y) 
Q(z, y) 


A Equação (9.16) é claramente uma equação diferencial ordinária de primeira ordem. Ela é de primeira ordem 
porque contém somente a derivada de primeira ordem e nenhuma derivada de ordem mais alta. É ordinária porque 
a única derivada, dy/dx, é uma derivada ordinária ou total. A Equação (9.16) pode ser ou não linear, embora vamos 
tratar explicitamente do caso linear mais adiante, Equação (9.25). 


dy 


do = f(2,9) = — (9.16) 


Variáveis Separáveis 
Fregiientemente a Equação (9.16) terá a forma especial 


(9.17) 


Então ela pode ser reescrita como 
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Integrar de (£o, yo) a (x, y) resulta em 


| POr f oao 


Uma vez que os limites inferiores, £o e yo, contribuem com constantes, podemos ignorar os limites inferiores de 
integração e simplesmente adicionar uma constante de integração. Note que essa técnica de separação de variáveis 
não requer que a equação diferencial seja linear. 


Exemplo 9.2.1  PÁRA-QUEDISTA 


Queremos achar a velocidade de queda de um pára-quedista como uma função do tempo e estamos particularmente 
interessados na velocidade limitadora constante vo, que aparece por causa do arraste, tomada como quadrática, 
—bv?, e que se opõe à força de atração gravitacional da Terra, mg. Escolhemos um sistema de coordenadas no qual 
a direção positiva é para baixo, de modo que a força gravitacional seja positiva. Por simplicidade, admitimos que 
o pára-quedas se abre imediatamente, isto é, no tempo t = 0, em que v(t = 0) = 0, nossa condição inicial. A lei 
de Newton aplicada ao pára-quedista em queda dá 


mi = mg — bv?, 


em que m inclui a massa do pára-quedas. 
A velocidade terminal, vo, pode ser encontrada pela equação de movimento quando t — co; quando não há 
aceleração, v = 0, portanto, 


mg 
bug = mg ou w=y z: 
Separamos as variáveis t e v, 
dv 
a 
Sat 
e integramos, decompondo o denominador em frações parciais. As raízes do denominador estão em v = +vo. Por 


conseguinte, 


b AT m 1 1 
g— —v = : 
m 2vob v+u vV—vo 


Integrando ambos os termos, temos como resultado 


f dV 1 mo v+ 


g- ÈV? 2V4 gb" w=v 


Resolvendo para a velocidade, obtemos 


o eT] o senh E 
= TER ° cosh £ pc 
em que T = é a constante de tempo que governa a aproximação assintótica da velocidade à velocidade-limite, 
vo. 
Utilizando valores numéricos, g = 9,8 m/s? e considerando b = 700 kg/m, m = 70 kg, temos vo = 


v9,8/10 ~ 1 m/s ~ 3,6 km/h ~ 2,23 mi/h, a velocidade de um pedestre na aterrissagem, e T = ,/Z = 


1//10-9,8 ~ 0,1 s. Assim, a velocidade constante vo é alcançada em um segundo. Por fim, como é sempre 
importante verificar a solução, verificamos que nossa solução satisfaz 
- cosht/Tvo sen h°t/T vo vo uv Da 


ka g v 


= cosht/TT cosh? UTT T To E mo 


isto é, a equação do movimento de Newton. O caso mais realista, quando o pára-quedista está em queda livre com 
uma velocidade inicial v; = v(0) > 0 antes de o pára-quedas se abrir, é abordado no Exercício 9.2.18. E 
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Equações Diferenciais Exatas 
Reescrevemos a Equação (9.16) como 


P(x,y) de + Q(x,y) dy = 0. (9.18) 
Diz-se que essa equação é exata se pudermos igualar o lado esquerdo dela a uma diferencial dy, 


o o 
do = Lda + Z dy. (9.19) 
dx Oy 
Uma vez que a Equação (9.18) tem um zero na direita, procuramos uma função desconhecida y(x, y) = constante 
e dy = 0. 
Temos (se tal função y(x, y) existir) 


_ 9p dy 
P(x,y) de + Q(x, y) dy = soda + g” (9.20a) 
e 9 2 
£ Z P(z,y), 2 = Q(z,y). (9.20b) 
Ox Oy 


A condição necessária e suficiente para nossa equação ser exata é que as derivadas parciais de segunda ordem 
mistas de y(x, y) (admitidas como contínuas) sejam independentes da ordem de diferenciação: 
dp  OP(z,y) _ Qz, y) dy 


dydr Oy da dxdy aN 


Observe a semelhança com as Equações (1.133a) da Seção 1.13, “Teoria do Potencial”. Se a Equação (9.18) 
corresponde a um rotacional (igual a zero), então deve existir um potencial y(x, y). 
Se p(x, y) existir, então, pelas Equações (9.18) e (9.20a), nossa solução é 


p(z, y) =C. 


Podemos construir y(x, y) a partir de suas derivadas parciais exatamente como construímos um potencial vetorial 
magnético na Seção 1.13 a partir de seu rotacional. Veja os Exercícios 9.2.7 e 9.2.8. 

Também pode perfeitamente acontecer que a Equação (9.18) não seja exata e que a Equação (9.21) não seja 
satisfeita. Contudo, sempre existe pelo menos um, e talvez uma infinidade de fatores de integração a(x, y), tal (ou 
tais) que 

a(z, y)P(z, y) dx + a(z, y)Q(z, y) dy =0 


seja exata. Infelizmente, um fator de integração nem sempre é óbvio ou fácil de achar. Diferente do caso da equação 
linear de primeira ordem que vamos considerar a seguir, não há nenhum modo sistemático para desenvolver um 
fator de integração para a Equação (9.18). 

Uma equação diferencial na qual as variáveis foram separadas é automaticamente exata. Uma equação 
diferencial exata não é necessariamente separável. 

O método da frente de onda da Seção 9.1 também funciona para uma EDP de primeira ordem: 

a(z, ga + bla, j =0. (9.22a) 
dx dy 

Procuramos uma solução da forma Y% = F (£), em que é(x,y) = constante para x e y define a frente de onda. Por 
conseguinte, 


dé = di + 2 =0, (9.22b) 
dx Oy 
enquanto a EDP resulta em 
oE oE \ dF 
—— — — E D, 
(age + 3 dE 0, (9.23a) 


com dF/dé O em geral. Comparando as Equações (9.22b) e (9.234), temos 


dx dy 


= .23b 
St (9.23b) 
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que reduz a EDP a uma ODE de primeira ordem para a tangente dy/dx da função de frente de onda &(x, y). 
Quando há um termo de fonte adicional na EDP, 


RO ay (9.230) 
dx dy 
então usamos o Ansatz 1) = Wo(x,y)F(é), que converte nossa EDP em 
Ovo Wo dF ( DE 3E 
(a ðx t Oy tari Nag dé Tii Oy 9 (ia 


Se pudermos imaginar uma solução Yo da Equação (9.23c), então a Equação (9.24) se reduz à nossa equação 
precedente, Equação (9.23a), da qual resulta a ODE da Equação (9.23b). 


EDOs Lineares de Primeira Ordem 
Se f(x,y) na Equação (9.16) tiver a forma —p(x)y + q(x), então a Equação (9.16) se torna 
dy 


ma plx)y = q(x). (9.25) 


A Equação (9.25) é a EDO linear de primeira ordem mais geral. Se q(x) = 0, a Equação (9.25) é homogênea 
(em y). Um q(x) não-zero pode representar um termo de fonte ou um termo dominante. A Equação (9.25) é 
linear; cada termo é linear em y ou dy/dx. Não há nenhuma potência mais alta, isto é, y2, e nenhum produto 
y(dy/dx). Note que a linearidade se refere ao y e dy/dx; p(x) e q(x) não precisam ser lineares em x. A 
Equação (9.25), a mais importante dessas EDOs de primeira ordem para a Física, pode ser resolvida exatamente. 

Vamos procurar um fator de integração a(x), de modo que 


d 
a(o) + a(2)p(2)y = o(z)a(x) (9.26) 
possa ser reescrita como 
d 
Ta [a(x)y] = a(a)g(a). (9.27) 


A finalidade disso é transformar o lado esquerdo da Equação (9.25) em uma derivada, de modo que ela possa ser 
integrada — por inspeção. A propósito, ela também torna a Equação (9.25) exata. Expandindo a Equação (9.27), 
obtemos 


Uma comparação com a Equação (9.26) mostra que devemos impor que 


E = a(a)pla). (9.28) 
T 


Eis aqui uma equação diferencial para a(x), com as variáveis a e x separáveis. Separamos variáveis, integramos 
e obtemos 


a(x) = exp | i l p(a) de (9.29) 


como nosso fator de integração. 
Com a(x) conhecido, passamos a integrar a Equação (9.27). E claro que, desde o início, esse foi o propósito de 
introduzir a. Temos 


/ l e lo(x)y(2)] de = / “alada: 


Agora, integrando por inspeção, temos 


aaya) = f alaja) de +C: 


As constantes provenientes de um limite de integração inferior constante estão embutidas na constante C'. 
Dividindo por a(x), obtemos 


va) = a] $ atajatodo + e} 
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Por fim, substituindo na Equação (9.29) a expressão de a, temos como resultado 


u(x) = exp |- I SA at f i Cléo | / W at a(s) ds + ch (9.30) 


Aqui as variáveis (mudas) de integração foram reescritas para torná-las não-ambíguas. A Equação (9.30) é a 
solução geral completa da equação diferencial linear de primeira ordem, Equação (9.25). A porção 


yı(x£) = Cexp |- T p(t) at (9.31) 


corresponde ao caso q(x) = O e é uma solução geral da equação diferencial homogênea. O outro termo na 


Equação (9.30), E E ; 
vala) = exp -f p(t) at n exp J p(t) at a(s) ds, (9.32) 


é uma solução particular correspondente ao termo de fonte específico q(x). 

Note que, se nossa equação diferencial linear de primeira ordem é homogênea (q = 0), então ela é separável. 
Caso contrário, à parte casos especiais como p = constante, q = constante e q(x) = ap(x), a Equação (9.25) não 
é separável. 

Vamos resumir essa solução da EDO não-homogênea em termos de um método denominado variação da 
constante, como segue. Na primeira etapa, resolvemos a EDO homogênea por separação de variáveis como antes, 
o que resulta em 


A x 
=p my=- f p(X)dX +C, ylz) = CeT S7 rax, 


Na segunda etapa, deixamos que a constante de integração se torne dependente de x, isto é, C — C(x). Essa é a 
“variação da constante” usada para resolver a EDO não-homogênea. Diferenciando y(x), obtemos 


y! = —pCe7 S rŒ) de Ea C'(a)e” SP) de — —py(a) de C'(ax)je” SPO dr, 


Comparando com a EDO não-homogênea, encontramos a EDO para C: 
re Setas = q, ou C(x) a eJ” POY A(X) dX. 
Substituindo esta C em y = C(x)e” JF p) dx reproduzimos a Equação (9.32). 


Exemplo 9.2.2 circurroRL 

Para um circuito resistivo-indutivo, a lei de Kirchhoff leva a 
dI(t 

ELO 


o + RICE) = V(t) 


para a corrente I(t), em que L é a indutância e R é a resistência, ambas constantes. V(t) é a tensão de entrada 
dependente do tempo. 
Pela Equação (9.29), nosso fator de integração a(t) é 


t 
R 
a(t) = exp f TË = e"l, 


Então, pela Equação (9.30), 


t 
V(t 
I(t) = e7 J a ) dt + c| : 
com a constante C' a ser determinada por uma condição inicial (uma condição de contorno). 
Para o caso especial V(t) = Vo, uma constante, 


Vo L V 
I = e7 Pt/L| 0 | Z oRt/L = Yo -Rt/L 
(t)=e T e +C + Ce 
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Se a condição inicial for 1(0) = 0, então C = —Vo/Re 


It) = n [1 — eim, 


E 
Agora vamos provar o teorema que diz que a solução da EDO não-homogênea é única até um múltiplo 
arbitrário da solução da EDO homogênea. 
Para mostrar isso, suponha que ambas, y1, y2, resolvem a EDO não-homogênea EDO, Equação (9.25): então 


yi — ya + p(z)(yı — y2) = 0 


resulta da subtração das EDOSs e diz que yı — y2 é uma solução da EDO homogênea. A solução da ODE homogênea 
sempre pode ser multiplicada por uma constante arbitrária. 

Também provamos o teorema que diz que uma EDO homogênea de primeira ordem tem somente uma 
solução linearmente independente. Essa afirmação tem o seguinte sentido: se duas soluções forem linearmente 
dependentes, por definição elas satisfazem ayı (x) + by2(x) = 0, com constantes não-zero a, b, para todos os 
valores de x. Se a única solução dessa relação linear for a = 0 = b, então diz-se que nossas soluções yı e yz são 
linearmente independentes. 

Para provar esse teorema, suponha que ambas, y1, y2, resolvem a EDO homogênea. Então, 


= = —p(x) = E implica W(x) = yiy2 — yiv = 0. (9.33) 


O determinante funcional W é denominado wronskiano do par y1, y2. Agora, mostramos que W = 0 é a condição 
para que eles sejam linearmente dependentes. Admitindo dependência linear, isto é, 


ayı (x) + bya(x) = 0 


com constantes não-zero a, b, para todos os valores de x, diferenciamos essa relação linear para obter uma outra 
relação linear, 
! ! = 
ayi (z) + byola) = 0. 


A condição para que essas duas equações lineares homogêneas nas incógnitas a, b tenham uma solução não-trivial 
é que seu determinante seja zero, ou seja, W = 0. 
Ao contrário, por W = (), resulta dependência linear, porque podemos achar uma solução não-trivial da relação 


1 


Ny) 


yı ya 


por integração, que resulta em 
ny = ln y2 + ln C ou yı = Cyo. 


Dependência linear e wronskiano são generalizados para três ou mais funções na Seção 9.6. 


Exercícios 
9.2.1 Pela lei de Kirchhoff, a corrente 7 em um circuito RC (resistivo-capacitivo) (Figura 9.1) obedece à 
equação 
dI 1 
so P= 
i dt C i 


(a) Ache I(t). 
(b) Para uma capacitância de 10.000 uF carregada a 100 V e descarregada por meio de uma 
resistência de 1 MQ, ache a corrente I para t = 0 e para t = 100 segundos. 


Nota: A tensão inicial é Io R ou Q/C, em que Q = fe I(t) dt. 
9.2.2 A transformada de Laplace da equação de Bessel (n = 0) leva a 
(82 +1) f(s) + sf(s) = 0. 


Resolva para f(s). 


416 
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9.2.3 


Figura 9.1: Circuito RC 


A degradação de uma população por colisões catastróficas de dois corpos é descrita por 


aN 
E SRNA 
dt 


Essa é uma equação diferencial não-linear de primeira ordem. Derive a solução 


mo =No(1+4) 


em que Tọ = (k No) !. Isso implica uma população infinita em t = —7o. 
A taxa de uma determinada reação química A + B — C é proporcional às concentrações dos 
reagentes Ae B: 


o = o[ A(O) == C(t)| [B(0) = ce). 


(a) Ache C(t) para A(0) £ B(0). 

(b) Ache C(t) para A(0) = B(0). 

A condição inicial é que C(0) = 0. 

Um barco navegando ao longo da costa experimenta uma força de resistência proporcional a v”, v 
sendo a velocidade instantânea do barco. A segunda lei de Newton leva a 


dv 
— = —kv”. 
my v 
Com v(t = 0) = vo, z(t = 0) = 0, integre para achar v como uma função do tempo e v como uma 
função da distância. 
Na equação diferencial de primeira ordem dy/dx = f(x,y) a função f(x, y) é uma função da razão 
y/z: 


E = glyfa). 


Mostre que a substituição de u = y/x leva a uma equação separável em u e x. 
A equação diferencial 
P(x,y) de + Q(x, y) dy = 0 


é exata. Construa uma solução 
z y 
plz, y) =| P(x,y) d+ | Q(xo,y) dy = constante. 
To Yo 


A equação diferencial 
P(x,y) de + Q(x,y) dy = 0 


ELSEVIER 
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9.2.11 


9.2.12 


9.2.13 


9.2.14 


9.2.15 


é exata. Se 2 j 
oes) | Pæsdet f Qoy) dy 
To Yo 
mostre que 
dp dp 


Por conseguinte, y(x, y) = constante é uma solução da equação diferencial original. 


Prove que a Equação (9.26) é exata no sentido da Equação (9.21), contanto que a(x) satisfaça a 
Equação (9.28). 
Uma certa equação diferencial tem a forma 


f(x) dx + g(x)h(y) dy = 0, 


sendo que nenhuma das funções f(x), g(x), h(y) é identicamente zero. Mostre que uma condição 
necessária e suficiente para essa equação ser exata é que g(x) = constante. 


u(x) = exp |- / E at f / CE | / A a a(s) ds + ch 


é uma solução de 


Mostre que 


d 
E + plula) = qla) 
por diferenciação da expressão para y(x) e substituição na equação diferencial. 


O movimento de um corpo em queda em um meio resistente pode ser descrito por 


quando a força de retardação é proporcional à velocidade, v. Ache a velocidade. Avalie a constante 
de integração impondo que v(0) = 0. 
Núcleos radioativos decaem conforme a lei 


daN 
2 =>AN 
dt a 


sendo N a concentração de um dado nuclídeo e À a constante particular de decaimento. Em uma 
série radioativa de n nuclídeos diferentes, começando com N4, 


dNı 


— =-AN 
dt 1441, 
dN. 
RE = A Ni — Ao No, e assim por diante. 


Ache No(t) para as condições Nı(0) = No e N2(0) = 0. 

A taxa de evaporação de uma determinada gota esférica de líquido (densidade constante) é 

proporcional à área de sua superfície. Admitindo que esse seja o único mecanismo de perda de 

massa, ache o raio da gota como uma função do tempo. 

Na equação diferencial linear homogênea 
dv 
— = —qu 
dt 

as variáveis são separáveis. Quando as variáveis são separadas, a equação é exata. Resolva essa 

equação diferencial sujeita a v(0) = vo pelos três métodos a seguir: 

(a) Separando variáveis e integrando. 

(b) Tratando a equação de variável separada como exata. 

(c) Usando o resultado para uma equação diferencial linear homogênea. 
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Resposta: v(t) = voe“. 


9.2.16 A equação de Bernoulli, 
dy n 
do T OW = gle)y”, 
x 


é não-linear para n Æ 0 ou 1. Mostre que a substituição u = y!”” reduz a equação de Bernoulli a 
uma equação linear (veja a seção 18.4). 
d 
Resposta: = +1- n)f(£ju = (1 — n)g(a). 
a 
9.2.17 Resolva a equação linear de primeira ordem, Equação (9.25), admitindo que y(x) = u(x)v(x), 
onde v(x) é uma solução da equação homogênea correspondente [g(x) = 0]. Este é o método de 
variação de parâmetros devido a Lagrange. Aplicamos o método a equações de segunda ordem 
no Exercício 9.6.25. 


9.2.18 (a) Resolva o Exemplo 9.2.1 para uma velocidade inicial v; = 60 mi/h, quando o pára-quedas se 
abre. Ache v(t). (b) Para um pára-quedista em queda livre, use o coeficiente de atrito b = 0,25kg/m 
e massa m = 70 kg. Qual é a velocidade limitadora neste caso? 


9.3 Separação de Variáveis 


As equações da Física Matemática listadas na Seção 9.1 são todas equações diferenciais parciais. Nossa primeira 
técnica para sua solução subdivide a equação diferencial parcial de n variáveis em n equações diferenciais 
ordinárias. Cada separação introduz uma constante de separação arbitrária. Se temos n variáveis, temos de 
introduzir n — 1 constantes, determinadas pelas condições impostas no problema que estamos resolvendo. 


Coordenadas Cartesianas 
Em coordenadas cartesianas, a equação de Helmholtz se torna 


Py Pp om 
da to tg TR v=O, OF 


usando a Equação (2.27) para o laplaciano. No momento, deixe que k? seja uma constante. Talvez o modo mais 
simples de tratar uma equação diferencial parcial como a Equação (9.34) seja subdividi-la em um conjunto de 
equações diferenciais ordinárias, o que pode ser feito como segue. Seja 


y(x, y, z) = X(x)Y (y)Z(2) (9.35) 


e substitua essa expressão de volta na Equação (9.34). Como sabemos que a Equação (9.35) é válida? Quando 
os operadores diferenciais em várias variáveis são aditivos na EDP, isto é, quando não há nenhum produto de 
operadores diferenciais em variáveis diferentes, o método de separação costuma funcionar. Continuamos a fazer 
as coisas no espírito do “vamos experimentar para ver se funciona”. Se nossa tentativa for bem-sucedida, então a 
Equação (9.35) será justificada. Se não for bem-sucedida, logo saberemos e então tentaremos um outro ataque, tal 
como funções de Green, transformadas integrais ou análise numérica de força bruta. Admitindo que Y seja dada 
pela Equação (9.35), a Equação (9.34) se torna 


dX d2y dz 
YZ XZ XY kXYZ=0. ; 
T TP + ai + 0 (9.36) 


Dividindo por Y% = XY Z e rearranjandos os termos, obtemos 


1 d2X 1Y 1æZ 
= —k? 87 
X da? Y dy Zdz Ro 


A Equação (9.37) exibe uma separação de variáveis. O lado esquerdo é uma função de x apenas, ao passo que o 
lado direito depende somente de y e z e não de x. Mas x, y e z são todas coordenadas independentes. O fato de 
a igualdade de ambos os lados depender de variáveis diferentes significa que o comportamento de x como uma 
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variável independente não é determinado por y e z. Por conseguinte, cada lado deve ser igual a uma constante, uma 
constante de separação. Escolhemos? 


1 d2X 
1Y A 
2 E 2 
Y dy Zdz E sa) 


Agora, voltando nossa atenção para a Equação (9.39), obtemos 


1 Y 1 dºZ 
E E a 9.40 
Y dy? E Z dz?" (240) 


e conseguimos uma segunda separação. Agora temos uma função de y igualada a uma função de z, como antes. 


Nós a resolvemos, como antes, igualando cada lado a uma outra constante de separação, 2 o m?, 


1 d2Y 7 

EE ni (9.41) 
Y dy 

1 œZ 

o -k +Ê Hm = -nrn?, (9.42) 


introduzindo uma constante n? por k? = 12 + m? + n? para produzir um conjunto simétrico de equações. Agora 
temos três EDOs ((9.38), (9.41) e (9.42)) para substituir a Equação (9.34). Nossa suposição (Equação (9.35)) foi 
bem-sucedida e, por conseguinte, justificada. 

Nossa solução deve ser rotulada de acordo com a escolha que fizemos das constantes l, m e n, isto é, 


Vim(2, 4,2) = Xı(2)Ym(y)Zn (2). (9.43) 


Contanto que sujeitos às condições do problema que está sendo resolvido e à condição k? = 1? + m? + n?, pode- 
mos escolher l, m e n como quisermos, e a Equação (9.43) ainda será uma solução da Equação (9.34), contanto 
que X;(x) seja uma solução da Equação (9.38), e assim por diante. Nós desenvolvemos a solução mais geral da 
Equação (9.34) considerando uma combinação linear de soluções “/,,,.» 


T= Y ambin (9.44) 
l,m 


Por fim, os coeficientes da constante am são escolhidos de modo a permitir que Y satisfaça as condições de 
fronteira do problema, que, como regra, leva a um conjunto discreto de valores l, m. 


Coordenadas Cilíndricas Circulares 
Como nossa função desconhecida 1) depende de p, y e z, a equação de Helmholtz se torna (veja a Seção 2.4 para 
v?) 

V?Ylo, p, z) + kblo, p, z) =0, (9.45) 


ou 


18 Ob 18y p a, 
2 (,%) Had ta ALL (9.46) 


Como antes, admitimos uma forma fatorada para W, 


Wlp; 9,2) = Plp)P(p)Z(2). (9.47) 
Substituindo na Equação (9.46), temos 
®Z d/ dP PZ d’ dz 
Po +k’ PZ =0. 9.48 
p Alo p? da da * Fe) 


2A escolha de sinal, completamente arbitrária aqui, em problemas específicos será fixada pela necessidade de satisfazer condições de 
contorno específicas. 
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Todas as derivadas parciais se tornaram derivadas ordinárias. Dividindo por PZ e passando a derivada z para o 
lado direito, temos como resultado 


1 d/ dP y 1 To pa 1 d2Z (9.49) 

pP dp E dp PS dy? — Zd’ i 
Novamente, uma função de z do lado direito parece depender de uma função de p e p do lado esquerdo. 

Resolvemos isso igualando cada lado da equação (9.49) à mesma constante. Vamos escolher? —/2. Então, 


dz 
gS 2Z (9.50) 
e 2 
1 df dP 1 o 
kesel, 51 
a + pç * fio 


Fazendo k? + l? = n?, multiplicando por pº, e rearranjando termos, obtemos 


pa/ dP e 1 o 
P ZENE 9.52 
Pa) d dy? gan 


Podemos estabelecer o lado direito para m? e 


dO 
Por fim, para a dependência de p, temos 
d / dP 


Essa é a equação diferencial de Bessel. As soluções e suas propriedades são apresentadas no Capítulo 11. A 
separação de variáveis da equação de Laplace em coordenadas parabólicas também dá origem à equação de Bessel. 
Podemos observar que a equação de Bessel é notória pela variedade de disfarces sob os quais pode aparecer. Se o 
leitor quiser uma tabulação extensiva de possíveis formas, pode consultar Tables of Functions por Jahnke e Emde.* 

A equação de Helmholtz original, uma EDP tridimensional, foi substituída por três EDOs, Equações (9.50), 
(9.53) e (9.54). Uma solução da equação de Helmholtz é 


Vlo, p, z) = Plo)P(p)Z(2). (9.55) 


Identificando as soluções específicas P, ®, Z por índices, vemos que a solução mais geral da equação de Helmholtz 
é uma combinação linear das soluções de produto: 


V(p, P, z) = 5 AmnPmn(P)Pm (9) Zn(2). (9.56) 


Coordenadas Polares Esféricas 
Vamos tentar separar a equação de Helmholtz, mais uma vez com k? constante, em coordenadas polares esféricas. 
Usando a Equação (2.48), obtemos 


1 ð (204 ð Oy 1 p] o 
r2senô sent or (r t) T (seno 3) * eng 092 | E Gan 
Agora, por analogia com a Equação (9.35), experimentamos 
Plr, 0, p) = ROJOS). (9.58) 


3A escolha de sinal da constante de separação é arbitrária. Contudo, escolhemos um sinal de menos para a coordenada 
axial z na expectativa de uma possível dependência exponencial de z (pela Equação (9.50)). Escolhemos um sinal positivo para a 
coordenada azimutal q na expectativa de uma dependência periódica de « (pela Equação (9.53)). 

4E. Jahnke e F. Emde, Tables of functions, 4%. ed. revista, Nova York: Dover (1945), p. 146; também E. Jahnke, F. Emde e F. Lösch, Tables 
of Higher Functions, 6% ed., Nova York: McGraw-Hill (1960). 
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Substituindo de volta na Equação (9.57) e dividindo por ROS, temos 


1 d/sdR 1 d do 1 ð č , 
9 =k. 9.59 
Rr? dr (r dr ) ord (sen ) Torani fe) 


Note que, agora, todas as derivadas são derivadas ordinárias em vez de parciais. Multiplicando por r? 
mbozsen?0, podemos isolar (1/6) (d2& /dy?) para obter” 


126 3 3 EA a. a 
126 E à go. 9.60 
& dy? Rs | r2R dr (r dr ) r? sendO do ( Ki ) i 


A Equação (9.60) relaciona uma função apenas de y a uma função de r e de O apenas. Uma vez que r, 0 e y são 
variáveis independentes, igualamos cada lado da Equação (9.60) a uma constante. Em quase todos os problemas 
físicos y aparecerá como um ângulo de azimute. Isso sugere uma solução periódica em vez de uma exponencial. 
Com isso em mente, vamos usar —m? como a constante de separação que, nesse caso, deve ser um inteiro ao 
quadrado. Então, 


1 doly) 5 
d dp CM (9.61) 
i 2 
1 d/ dR 1 d do E a 
r2R dr (r dr ) T r2 senĝO d0 ( seno do ) P2 sen20 * kº. (9.62) 


Multiplicando a Equação (9.62) por r? e rearranjando os termos, obtemos 


1dfdR\ 33 1 df dO m 
TAC £) E S T= +; (seno 7) + sendo (220) 


Mais uma vez, as variáveis são separadas. Igualamos cada lado a uma constante, Q, e finalmente obtemos 


1 d do m? 
0 = .64 
seng do (sen do ) nS Pos =, (ba) 
1d (548 so OR. 


Mais uma vez substituímos a equação diferencial parcial de três variáveis por três EDOs. As soluções dessas EDOs 

são discutidas nos Capítulos 11 e 12. No Capítulo 12, por exemplo, a Equação (9.64) é identificada como a equação 

associada de Legendre, na qual a constante Q se torna (l+ 1); l é um inteiro não-negativo porque 0 é uma variável 

angular. Se k? é uma constante (positiva), a Equação (9.65) se torna a equação esférica de Bessel da Seção 11.7. 
Novamente, nossa solução mais geral pode ser escrita 


Yom”, 0, p) = 5 agmBo ()Ogm(9)Bm(ç). (9.66) 
Qm 


A restrição de que k? seja uma constante é desnecessariamente severa. O processo de separação ainda será possível 


para k? tão geral quanto 
1 
k? = f(r) + 9(8) + 
F 


No problema do átomo de hidrogênio, um dos exemplos mais importantes da equação de onda de Schrödinger 
com uma solução de forma fechada é k? = f(r), com k? independente de 0, y. A Equação (9.65) para o átomo de 
hidrogênio se torna a equação associada de Laguerre. 

A grande importância dessa separação de variáveis em coordenadas polares esféricas se origina do fato de 
que o caso k? = k?(r) abrange uma imensa parte da Física: uma grande quantidade das teorias de gravitação, 
eletrostática e da física atômica, nuclear e de partículas. Além disso, com k? = k2(r), a dependência angular é 
isolada nas Equações (9.61) e (9.64), que podem ser resolvidas exatamente. 


>—h k'2. .67 
r2sen20 (p) + ED 


5 Aqui, a ordem na qual as variáveis são separadas não é única. Muitos textos de Mecânica Quântica mostram primeiro a subdivisão da 
dependência de r. 


“livro” — 2007/8/1 — 15:06 — page 422 — #432 


422 Física Matemática Arfken e Weber ELSEVIER 


Por fim, para ilustrar como a constante m na Equação (9.61) é restrita, observamos que y em coordenadas 
polares esféricas e cilíndricas é um ângulo de azimute. Se este é um problema clássico, certamente vamos exigir 
que a solução azimutal (y) seja de valor único; isto é, 


S(p + 27) = (Y). (9.68) 


Isso equivale a exigir que a solução azimutal tenha um período de 27 é Por conseguinte, m deve ser um inteiro. 
Qual inteiro será depende dos detalhes do problema. Se o inteiro |m| > 1, então & terá o período 27/m. Sempre 
que uma coordenada corresponde a um eixo de translação ou a um ângulo de azimute, a equação separada tem a 
forma 


d2B() 2 
= -mP 
o (p) 
para ọ, o ângulo de azimute, e 
d2Z(2) 5 
Eon = Eqa Z(z) (9.69) 


para z, um eixo de translação do sistema de coordenadas cilíndricas. Claro que as soluções são senaz e cos az, 
para —a?, e a função hiperbólica correspondente (ou exponenciais) sen haz e cos haz para, +a?. 


Tabela 9.2 Soluções em coordenadas polares esféricas” 


= 5 Gm Vim 
l, 


b 
rl P™ (cos) cos my 
1. V24h=0 = ; 
ý Vim pa f QT (cos 8) senmy 
(kr Př” (cos 6 cos m 
2. V2y+kyY=0 Pim = jal E ) p 
nı(kr QP (cos 0) senmy 
k P” 0 3 
VERSO de i(kr) m (cos 0) cos my 
ki(kr) QT (cos 0) senmp 
“Referências para algumas das funções P/”(cos0),m = 0, Seção 12.1; m 0, Seção 12.5; 


Q7? (cos 0), Seção 12.10; jı (kr), ni(kr), dl: e ki(kr), Seção 11.7. 
bcos mo e senmp podem ser substituídos por e=ime, 


Entre outras EDOs que aparecem de vez em quando estão as equações de Laguerre e as equações associadas de 
Laguerre do problema de suprema importância do átomo de hidrogênio na Mecânica Quântica: 


dy dy 
dy dy 


d 
—S — 2r + 2ay = 0. (9.72) 


l-z) — To + n?°y=0. (9.73) 


Para referência conveniente, as formas das soluções da equação de Laplace, da equação de Helmholtz e da equação 
de difusão para coordenadas polares esféricas estão reunidas na Tabela 9.2. As soluções da equação de Laplace em 
coordenadas cilíndricas circulares são apresentadas na Tabela 9.3. 


6Isso também se aplica à maioria dos problemas de Mecânica Quântica, mas o argumento é muito mais complicado. Se m não for um 
inteiro, as relações de grupo de rotação e as relações de operador progressivo (Seção 4.3) são rompidas. Compare com E. Merzbacher, Single 
valuedness of wave functions. Am. J. Phys. 30: 237 (1962). 
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Propriedades gerais que resultam da forma das equações diferenciais são discutidas no Capítulo 10. As soluções 


individuais são desenvolvidas e aplicadas nos Capítulos 11-13. 


O físico praticante pode encontrar, e provavelmente encontrará, outras EDOs de segunda ordem, algumas das 


quais talvez seja possível transformar nos exemplos estudados aqui. Algumas dessas EDOs podem ser resolvidas 
pelas técnicas das Seções 9.5 e 9.6. Outras talvez precisem de um computador para uma solução numérica. 


Tabela 9.3 Soluções em coordenadas cilíndricas circulares 


Y = 5 amaYma 
2 D a Jm(@p) cos MY e 922 
a V w +a Y =0 Vma =Z l Nm(ap) senmy e27 
e ds One = Im(ap) cos MY cos az 
b. Vp-ayp=-0 Parar Km(ap) senmy senaz 


“Referências para as funções radiais são Jm (ap), Seção 11.1; Nm (ap), Seção 11.3; Im (ap) e 
Km(ap), Seção 11.5. 


Referimo-nos à segunda edição deste texto para outros importantes sistemas de coordenadas. 

Para colocar em perspectiva o método de separação para resolver EDPs, vamos revisá-lo como uma consegiiência 
de uma simetria da EDP. Considere como exemplo a equação estacionária de Schrödinger Hy = Ey com 
um potencial V(r) que depende somente da distância radial r. Então, essa EDP é invariante sob rotações que 
compreendem um grupo SO(3). Seu gerador diagonal é o operador de momento angular orbital L, = Lidos 
e sua invariante quadrática (de Casimir) é L2. Visto que ambas comutam com H (veja a Seção 4.3), acabamos 
com três equações de autovalor separadas: 


Hó=Ey,  LVy=(IA+D),  Ly=my. 


Substituindo L2 em L? por seu autovalor m2, a EDO para L? se torna a EDO de Legendre e, de modo 
semelhante, Hy = Ey se torna a EDO radial do método de separação em coordenadas polares esféricas. 

Para coordenadas cilíndricas, a EDP é invariante sob rotações em torno do eixo z somente, o que forma um 
subgrupo de SO(3). Essa invariância resulta no gerador L, = —i0/0p e na EDO azimutal separada Lzy = my, 
como antes. Se o potencial V for invariante sob translações ao longo do eixo z, então o gerador —id/0z dá a 
EDO separada na variável z. 

Em geral (veja a Seção 4.3), há n geradores mutuamente comutativos H;, com autovalores m; do (clássico) 
grupo de Lie, G de ordem n e as invariantes de Casimir correspondentes C; com autovalores c;, que resultam 
nas EDOs separadas 


Hy = my, Ciy = ciy, 
além da EDO H4 = Ey (agora) radial. 


Exercícios 


9.3.1 Deixando o operador V? +k? agir sobre a forma geral a1; (x, y, Z) + azWs(x,y, z), mostre que 
ela é linear, isto é, que (V ? +k?) (aiy + azp) = (V? +k?) + as (V? +k?) 
9.3.2 Mostre que a equação de Helmholtz, 


V?y +k’Y=0, 


ainda é separável em coordenadas cilíndricas circulares se k? for generalizada para k? + f(p) + 
(1/02) (49) + h(2). 

9.3.3 Separe variáveis na equação de Helmholtz em coordenadas polares esféricas, subdividindo em 
primeiro lugar a dependência radial. Mostre que suas equações separadas têm a mesma forma 
que as Equações (9.61), (9.64) e (9.65). 
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9.3.4 Verifique que 

1 
y? 0 k? = 9(0) + =—h 9,9) = 0 
W(1,0,9) + |K + FC) + 590) + gO) | b(r,0,9) 
é separável (em coordenadas polares esféricas). As funções f,g e h são funções só das duas 
variáveis indicadas; k? é uma constante. 

9.3.5 Uma partícula atômica (na Mecânica Quântica) está confinada dentro de uma caixa retangular de 
lados a,b e c. A partícula é descrita por uma função de onda y que satisfaz a equação de onda de 
Schrödinger 

he 

—— Vºy = EY. 

2m 
A função de onda deve se anular em cada superfície da caixa (mas não para ser identicamente zero). 
Essa condição impõe restrições às constantes de separação e, portanto, à energia E. Qual é o menor 
valor de E para o qual tal solução pode ser obtida? 

neh d 1 1 
R ta: E = E 
esposta Zm (= + p2 + 3) 

9.3.6 Para um sólido esférico homogêneo com difusibilidade térmica constante K, e nenhuma fonte de 

calor, a equação de condução de calor se torna 
9T(r,t) 
Cu KV?T (r,t). 
= (r,t) 

Admita uma solução da forma 

T = R(r)T(t) 
e separe variáveis. Mostre que a equação radial pode assumir a forma padrão 

d2R dR 
a + 2r + [a?r? — n(n + 1)|R = 0; n = inteiro. 

As soluções dessa equação são denominadas funções esféricas de Bessel. 

9.3.7 Separe variáveis na equação de difusão do Exercício 9.3.6 em coordenadas cilíndricas circulares. 
Admita que você pode desprezar efeitos finais e considere T = T (p, t). 

9.3.8 O operador de momento angular da mecânica quântica é dado por L = —i (r x V). Mostre que 

L- Ly =1(l +14 
leva à equação associada de Legendre. 
Sugestão: Os Exercícios 1.9.9 e 2.5.16 podem ajudar. 
9.3.9 A equação de onda unidimensional de Schrödinger para uma partícula em um campo de potencial 


V = ikr? é 


(a) Usando é = ax e uma constante À, temos 


= mk 1/4 AE ce m a 
=e i ENE É 


dY(E) 
dg? 


mostre que 


+(1-)u(g) = 


(b) Substituindo i 
YE) = yE) E 2, 


mostre que y(£) satisfaz a equação diferencial de Hermite. 
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9.3.10 Verifique que as seguintes são soluções da equação de Laplace: 


rz 
r—z 


1 
(Db =Hrr£o  Ou=sdn 


Nota: As z derivadas de 1/r geram os polinômios de Legendre, P, (cos 0), Exercício 12.1.7. As z 
derivadas de (1/27) In[(r + 2) /(r — z)] geram as funções de Legendre, Qn (cos 0). 


9.3.11 Se Y é uma solução da equação de Laplace, V2Y = 0, mostre que 0Y /ôz também é uma solução. 


9.4 Pontos Singulares 
Nesta seção apresentamos o conceito de ponto singular ou singularidade (como aplicado a uma equação 
diferencial). O interesse nesse conceito surge de sua utilidade para (1) classificar EDOs e (2) investigar a viabilidade 
de uma solução de série. Essa viabilidade é o tópico do teorema de Fuchs, Seções 9.5 e 9.6. 
Todas as EDOS listadas na Seção 9.3 podem ser resolvidas para d?y/dx?2. Usando a notação d2y/dx? = y”, 
temos” 
y” = Hay y). (9.74) 


Se escrevermos nossa equação diferencial homogênea de segunda ordem (em y) como 
y” + P(z)y' + Qla)y = 0, (9.75) 


estamos prontos para definir pontos ordinários e singulares. Se as funções P(x) e Q(x) permanecerem finitas em 

£z = To, O ponto x = zo será um ponto ordinário. Contudo, se P(x) ou Q(x) (ou ambos) divergir à medida que 

£z — To, O ponto xo será um ponto singular. Usando a Equação (9.75), podemos distinguir entre duas espécies de 
pontos, singulares. 

1. Se P(x) ou Q(x) divergir, à medida que x — xo, mas (x — xo)P(x) e 
(x — £0)?Q(x) permanecerem finitas, à medida que x — «xo, então x = xo será denominado ponto singular 
regular ou não-essencial. 

2. Se P(x) divergir mais rapidamente do que 1/(« — zo), de modo que (x — xo) P(x) vai ao infinito, à medida que 
x — xo ou Q(x) divergir mais rapidamente do que 1/(x — x9)2, de modo que (x — xo)? Q(x) vai ao infinito, à 
medida que x — «xo, então o ponto x = xo será denominado singularidade irregular ou essencial. 

Essas definições são válidas para todos os valores finitos de xo. A análise do ponto x — oo é semelhante ao 
tratamento de funções de uma variável complexa (Seção 6.6). Estabelecemos x = 1/z, substituímos na equação 
diferencial e então deixamos que z — 0. Trocando variáveis nas derivadas, temos 


dy(z)  dy(el)dz 1 dy(z?)  ady(e?) 


dz dz dr xz? dz dz ’ eso) 
d’y(x) — d | dy(x)| dz E ( 2) 2z dy!) 2 dy(z!) 
dx? dz| dr |dx dz dz? 
dy(z!) | adêy(z) 
3 4 
2z L q2 (9.77) 
Usando esses resultados, transformamos a Equação (9.75) em 
dy -1y dy a 
BT [22 —2P(z Ji + RE 0: (9.78) 


Nesse caso, o comportamento de x = oo(z = 0) depende do comportamento dos novos coeficientes, 


2z — P(21) (e!) 


zZ 


à medida que z — 0. Se essas duas expressões permanecerem finitas, o ponto x = œ é um ponto ordinário. Se 
elas divergirem não mais rapidamente do que 1/z e 1/2?, respectivamente, o ponto x = oo será um ponto singular 
regular; caso contrário, será um ponto singular irregular (uma singularidade essencial). 


7Essa notação “com linha”, y’ = dy/dx, foi introduzida por Lagrange no final do século XVIII como uma abreviação para a notação de 
Leibniz, mais explícita, porém mais trabalhosa, dy /dz. 
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Exemplo 9.4.1 
A equação de Bessel é 

ey" +ay + (£? -n)y=0. (9.79) 


Comparando-a com a Equação (9.75), temos 


Tabela 9.4 
Singularidade  Singularidade 
Regular Irregular 

Equação g= g= 

1. Hipergeométrica 0,1,00 — 
x(x — 1)y” + [(1 +a + b)z — cly’ + aby = 0. 

2. Legendre —1,1,00 — 
1-2dy" — 2xy' +UL4Dy=0. 

3. Chebyshev —1,1,00 — 
(1 — x?)y" — xy' +nºy=o0. 

4. Hipergeométrica confluente 0 00 
zy” + (c — a)y' —ay=0. 

5. Bessel 0 00 
gy! +ay + (£? — n?)y = 0. 

6. Laguerre“ 0 00 
zy” + (1— x)y' +ay=o0. 

7. Oscilador harmônico simples — o0 
y! +wly=0. 

8. Hermite — 00 


y” — 2xy' + 2ay = 0. 


a As equações associadas têm os mesmos pontos singulares. 


o que mostra que o ponto x = 0 é uma singularidade regular. Por inspeção, vemos que não há outros pontos 
singulares na faixa finita. A medida que x — oo(z — 0), temos, pela Equação (9.78), os coeficientes 


2z— z REE 
e E, 


2 4 


z zZ 


Uma vez que a última expressão diverge como 21, o ponto x = œ é uma singularidade irregular, ou essencial. E 


As equações diferenciais ordinárias da Seção 9.3, mais duas outras equações, a hipergeométrica e a 
hipergeométrica confluente, têm pontos singulares, como mostra a Tabela 9.4. 

Veremos que todas as primeiras três equações da Tabela 9.4, hipergeométrica, Legendre e Chebyshev, têm três 
pontos singulares regulares. A equação hipergeométrica, com singularidades regulares em 0, 1 e co é considerada 
o padrão, a forma canônica. Então, as soluções das outras duas podem ser expressas em termos das soluções dela, 
as funções hipergeométricas, o que faremos no Capítulo 13. 

De modo semelhante, a equação hipergeométrica confluente é considerada a forma canônica de uma equação 
diferencial linear de segunda ordem com um ponto singular regular e um ponto singular irregular. 


Exercícios 
9.4.1 Mostre que a equação de Legendre tem singularidades regulares em x = —1, 1, e 00. 
9.4.2 Mostre que a equação de Laguerre, assim como a equação de Bessel, tem uma singularidade regular 
em x = 0 e uma singularidade irregular em x = oo. 
9.4.3 Mostre que a substituição 
z= E, a= -—l, b=l+1, c=1 


converte a equação hipergeométrica na equação de Legendre. 
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9.5 Soluções de Série — Método de Frobenius 
Nesta seção desenvolvemos um método para obter uma solução da EDO linear homogênea de segunda ordem. O 
método, uma expansão de série, sempre funcionará, contanto que o ponto de expansão não seja pior do que um 
ponto singular regular. Em Física, essa condição muito branda é quase sempre satisfeita. 

Uma EDO linear homogênea de segunda ordem pode ser colocada na forma 


Dr Pla + Qay =0. (9.80) 
T dx 


A equação é homogênea porque cada termo contém y(x) ou uma derivada; linear, porque cada y, dy/dx ou 
d?y/dx? aparece como a primeira potência — e nenhum produto. Nesta seção desenvolvemos (ao menos) uma 
solução da Equação (9.80). Na Seção 9.6 desenvolvemos a segunda solução, independente, e provamos que não 
existe nenhuma terceira solução independente. Por conseguinte, a solução mais geral da Equação (9.80) pode 
ser escrita como 


y(x) = c1yı (£) + coyo(a). (9.81) 


Nosso problema físico pode levar a uma EDO linear não-homogênea, de segunda ordem 


qa TPO te = Pla). (9.82) 


A função da direita, F(x), representa uma fonte (tal como uma carga eletrostática) ou uma força propulsora (tal 
como em um oscilador forçado). Soluções específicas dessa equação não-homogênea são abordadas rapidamente 
no Exercício 9.6.25. Elas são exploradas com um certo detalhe usando as técnicas de função de Green, nas Seções 
9.7 e 10.5, e com uma técnica de transformada de Laplace na Seção 15.11. Denominando essa solução yp, podemos 
adicioná-la a qualquer solução da equação homogênea correspondente, a Equação (9.80). Daí, a solução mais geral 
da Equação (9.82) é 


y(x) = cryilx) + c2y2(£) + yp(x). (9.83) 


As constantes cy e c2 serão eventualmente fixadas por condições de contorno. 

Por enquanto, admitimos que F'(x) = 0 e que nossa equação diferencial é homogênea. Tentaremos desenvolver 
uma solução para nossa equação diferencial linear homogênea de segunda ordem, Equação (9.80), pela substituição 
por uma série de potências com coeficientes indeterminados. Também está disponível como um parâmetro a 
potência do menor termo da série que não se anula. Como ilustração, aplicamos o método a duas equações 
diferenciais importantes, primeiro à equação do oscilador linear (clássico) 


dy 
= +w?y=0, (9.84) 


com soluções conhecidas y = senwz, cos wg. 
Experimentamos 


ylz) = 2º (ao + a£ + azz? + azr? +- -) 


= `o art tà, ao £ 0, (9.85) 
A=0 


com o expoente k e todos os coeficientes a, ainda indeterminados. Note que k não precisa ser um inteiro. 
Diferenciando duas vezes, obtemos 


+= SE axlk + Ae tT, 
dx e 
d2y < k+A-—2 
qa SD + ARA x 
A=0 


Substituindo na Equação (9.84), temos 


X alk + A+ A Int H w SS aat =0, (9.86) 
A=0 A=0 
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Pela nossa análise da unicidade da série de potências (Capítulo 5), os coeficientes de cada potência de x no lado 
esquerdo da Equação (9.86) devem desaparecer individualmente. 

A potência mais baixa de x que aparece na Equação (9.86) é "2, para À = O no primeiro somatório. A 
exigência de que o coeficiente desapareça? resulta em 


Escolhemos ao como o coeficiente dos termos mais baixos que não desaparecem da série (Equação (9.85)); daí, 
por definição, ao 0. Por conseguinte, temos 


k(k— 1) =0. (9.87) 


Denominamos essa equação, que vem do coeficiente da potência mais baixa de x, equação indicial. A equação 
indicial e suas raízes têm importância crítica para nossa análise. Se k = 1, o coeficiente a(k + 1)k de x*—! deve 
desaparecer, de modo que a; = 0. Claro que nesse exemplo devemos exigir que k = 0 ou k = 1. 

Antes de considerarmos essas duas possibilidades para k, voltamos à Equação (9.86) e impomos que os 
coeficientes líquidos restantes, digamos, o coeficiente de ax" + (j > 0), desapareçam. Estabelecemos À = j + 2 no 
primeiro somatório e À = j no segundo. (São somatórios independentes e À é um índice mudo). Isso resulta em 


analk+j+k+j+D)+w2a;=0 


ou 


w2 


“kr ++ IAI) 


Essa é uma relação de recorrência de dois termos.” Dado aj, podemos calcular aj+2 e então a;+4, 4;+6, € assim 
por diante, até o ponto que desejarmos. Note que, para esse exemplo, se começarmos com ao, a Equação (9.88) leva 
aos coeficientes pares a2, a4, e assim por diante, e ignora a1, a3, a5, € assim por diante. Visto que a; é arbitrário se 
k = 0 e necessariamente zero se k = 1, vamos igualá-lo a zero (compare com os Exercícios 9.5.3 e 9.5.4) e então, 
pela Equação (9.88) 


Aj+2 = (9.88) 


ag=a=a==0, 


e todos os coeficientes de número ímpar desaparecem. As potências ímpares de x na verdade reaparecerão quando 
for usada a segunda raiz da equação indicial. 

Voltando à Equação (9.87), nossa equação indicial, em primeiro lugar experimentamos a solução k = 0. A 
relação de recorrência (Equação (9.88)) se torna 


2 


w 
+42 = i 9.89 
UTAD! Reu 
o que leva a 
w? w? 
42 = -uT = Tg 
g2 4 
ai S E F 
w? wê 
aş = -urg = Tr e assim por diante. 
Por inspeção (e indução matemática), 
2n 
a 
azn = (—1) n) (9.90) 
e nossa solução é 
wr)? wg)t wr)’ 
y(x)k=0 = ao |1 ( =) ( E ( =) = ao COS WT. (9.91) 


8Ver a unicidade de séries de potência, Seção 5.7. 
9 A relação de recorrência pode envolver três termos, isto é, aj+2, dependendo de a; e aj—2. A Equação (13.2) para as funções de Hermite 
fornecem um exemplo desse comportamento. 
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Se escolhermos a raiz da equação indicial k = 1 (Equação (9.88)), a relação de recorrência se torna 


2 


Ww 
Eae = - . 9.92 
e A EITA ea 
Substituindo em j = 0, 2, 4, sucessivamente, obtemos 
w? w? 
az = “5.3 = Tzr 
o w2 wt 
aq = -a275 = + zya, 
w? wô 
aş = “Usa = EC TR, e assim por diante. 
Mais uma vez, por inspeção e indução matemática, 
w?” 
n = (—1)” 9.93 
as ( ) (2n + p ( ) 
Para essa escolha, k = 1, obtemos 
o (wr)? (wr) (wa) : 
y(z)k=1 = aox h 3] 5I z 7 
w (wr)? | (wr) (wr) 
Fy x) de O ua] 7 
= DO senwz. (9.94) 
w 


Para resumir essa abordagem, podemos escrever a Equação (9.86) esquematicamente, como mostra a Figura 9.2. 
Pela unicidade da série de potências (Seção 5.7), o coeficiente total de cada potência de x deve desaparecer por si 
só. A exigência de que o primeiro coeficiente (1) desapareça leva à equação indicial, Equação (9.87). O segundo 
coeficiente é manipulado estabelecendo ay = 0. A desaparição do coeficiente de x! (e de potências mais altas, 
tomadas uma por vez) leva à relação de recorrência, Equação (9.88). 


I I HI IV 


agklk- 1) [824 [a (k+ Dk xt + | a(k +2)X(k + 1) |x*+ | a(k +3Xk+2) [at TA 
+| aço? +] ao? 


* 
$ 


— =0 — =0 
Figura 9.2: Relação de recorrência de expansão de série de potências. 


Essa substituição de série, conhecida como método de Frobenius, nos deu duas soluções de série da equação do 
oscilador linear. Contudo, há dois pontos nessas soluções de série que precisam ser muito enfatizados: 

1. A solução de série sempre deve ser substituída de volta na equação diferencial para ver se funciona, uma 
precaução contra erros algébricos e lógicos. Se funcionar, ela é uma solução. 

2. A aceitabilidade de uma solução de série depende de sua convergência (incluindo convergência assintótica). É 
bem possível que o método de Frobenius dê uma solução de série que satisfaça a equação diferencial original 
quando substituída na equação, mas que não convirja na região de interesse. A equação diferencial de Legendre 
ilustra essa situação. 


Expansão em Torno de xo 


A Equação (9.85) é uma expansão em torno da origem, xo =0. É perfeitamente possível substituir a Equação (9.85) 
por 


ylz) =X lr)  ao#0. (9.95) 
A=0 
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De fato, no caso das equações de Legendre, Chebyshev e hipergeométricas, escolher xo = 1 tem algumas 
vantagens. O ponto xo não deve ser escolhido em uma singularidade essencial — ou nosso método de Frobenius 
provavelmente falhará. A série resultante (xo um ponto ordinário ou um ponto singular regular) será válida onde ela 
convergir. Você pode esperar algum tipo de divergência quando |x — xo| = |zs — xo|, em que zs é a singularidade 
mais próxima de xo (no plano complexo). 


Simetria de Soluções 
Vamos observar que obtemos uma solução de simetria par, y (1) = yı(—x), e uma de simetria ímpar, yo(x) = 
—y2(— x). Isso não é apenas um acidente, mas uma consequência direta da forma da EDO. Escrevendo uma EDO 


geral como 
£(z)y(x) =0, (9.96) 


na qual L(x) é o operador diferencial, vemos que, para a equação do oscilador linear (Equação (9.84)), L(x) é par 
sob paridade; isto é, 
L(x) = L(—a). (9.97) 
Sempre que o operador diferencial tiver uma paridade ou simetria específica, par ou ímpar, podemos permutar 
+z e —x, e a Equação (9.96) se torna 
+L(x)y(—x) = 0, (9.98) 


+ se L(x) for par, — se L(x) for ímpar. É claro que, se y(x) for uma solução da equação diferencial, y(—s:) 
também é uma solução. Então, qualquer solução pode ser resolvida em partes par e ímpar, 


ylz) = 5 [u(x) + y(—2)] + 5 [y(z) — y(-a)), (9.99) 


sendo que o primeiro colchete da direita dá uma solução par, e o segundo, uma solução ímpar. 

Se nos referirmos à Seção 9.4, podemos ver que todas as equações (ou operadores diferenciais) de Legendre, 
Chebyshev, Bessel, oscilador harmônico simples e Hermite exibem essa paridade par; isto é, sua P(x) na 
Equação (9.80) é ímpar e Q(x) é par. Soluções de todas essas equações podem ser apresentadas como séries 
de potências pares de x e séries separadas de potências ímpares de x. O operador diferencial de Laguerre não tem 
simetria par nem ímpar; daí, não podemos esperar que suas soluções exibam paridade par ou ímpar. Nossa ênfase 
na paridade se origina primariamente da importância da paridade na Mecânica Quântica. Constatamos que funções 
de onda habitualmente são pares ou ímpares, o que quer dizer que elas têm uma paridade definida. A maioria das 
interações (o decaimento beta é uma grande exceção) também é par ou ímpar, e o resultado é que a paridade é 
conservada. 


Limitações da Abordagem de Série - Equação de Bessel 
Essa abordagem sobre a equação do oscilador linear talvez tenha sido um pouco fácil demais. Substituindo as séries 
de potências (Equação (9.85)) na equação diferencial (Equação (9.84)), obtemos duas soluções independentes sem 
problema algum. 

Para ter uma idéia do que pode acontecer, tentamos resolver a equação de Bessel, 


vy + zy + (x? —n?°)y =0, (9.100) 


usando y’ em lugar de dy/dx e y” em lugar de d?y/dx?. Novamente, admitindo uma solução da forma 


OO 
ylz) =>, aah, 
A=0 


diferenciamos e substituímos na Equação (9.100). O resultado é 


Da +A)(k +A Dat + Sand + Ajat 
A=0 A=0 


+S aa SS anat t = 0. (9.101) 
A=0 A=0 


Fazendo À = 0, obtemos o coeficiente de x*, a potência mais baixa de x que aparece do lado esquerdo, 


aolk(k— 1) +k—n2?] =0, (9.102) 
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e novamente ao Æ O por definição. Por conseguinte, a Equação (9.102) resulta na equação indicial 


k —-n2=0, (9.103) 


com soluções k = +n. 
É interessante examinar o coeficiente de *+1 também. Nesse caso, obtemos 


allk+I)k+k+1-n”]=0, 


ou 


a(k+1-n)(k+1+n)=0. (9.104) 


Para k = +n, nem k + 1 — n nem k + 1 + n desaparece, e nós devemos exigir que a; = 0.1º 
Passando para o coeficiente de x*+i para k = n, fazemos À = j no primeiro, segundo e quarto termos da 
Equação (9.101) e À = j — 2 no terceiro termo. Impondo que o coeficiente resultante de «+! desapareça, obtemos 


aj|(n+j)(n+j-1)+ (n+ j) - n?] +aj-o =0. 
Quando j é substituído por j + 2, essa expressão pode ser reescrita para j > O como 


1 


Aj+2 = —Qj — z ; 9.105 
a (j +2)(2n +j +2) ( ) 
que é a relação de recorrência desejada. A aplicação repetida dessa relação de recorrência leva a 
1 aon! 
a = a = 
E Om)  2Um+D! 
1 aon! 
Aq = a — 
i AnA) An 2) 
1 aon! ; diant 
aş = —a = e assim por diante, 
e 16n +6) 23n +3) E 
e, em geral, 
aon! 
= (—1)? ; 9.106 
42p ( ) 22pp!(n + p)! ( ) 
Inserindo esses coeficientes em nossa solução de série admitida, temos 
nlr? nta? 
= ni | e 9.107 
= Mk | PI(n tD! 22n +2)! | da 
Em forma de somatório 
 nlgrtU 
=q 
° Do V jN (n+ j)! 
= n+2j 
= a02" n! . 9.108 
rm ste rn(d) pus 


No Capítulo 11 o somatório final é identificado como a função de Bessel J, (x). Note que essa solução, J, (x), 
tem simetria par ou simetria ímpar,!! como seria de esperar da forma da equação de Bessel. 

Quando k = —n e n não é um inteiro, podemos gerar uma segunda série distinta, a ser rotulada J. (a). 
Contudo, quando —n é um inteiro negativo, começa a dificuldade. A relação de recorrência para os coeficientes aj 
ainda é dada pela Equação (9.105), mas com 2n substituído por —2n. Então, quando j + 2 = 2n ou j = 2(n — 1), 
o coeficiente a; 2 aumenta demais e não temos nenhuma solução de série. Essa catástrofe pode ser remediada na 
Equação (9.108), como é feito no Capítulo 11, e o resultado é que 


J-nl(x£) = (—1)” Ja(a), n um inteiro. (9.109) 


10k = +n = — 5 são exceções. 
1 J, (x) é uma função par se n for um inteiro par, uma função ímpar se n for um inteiro ímpar. Para n não-inteiro, o x” não tem tal simetria 


simples. 
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A segunda solução simplesmente reproduz a primeira. Não conseguimos construir uma segunda solução 
independente para a equação de Bessel por essa técnica de série quando n é um inteiro. 

Substituindo em uma série infinita, obtivemos duas soluções para a equação do oscilador linear e uma para a 
equação de Bessel (duas se n não for um inteiro). A resposta às perguntas “Sempre podemos fazer isso”, “Esse 
método sempre funcionará?” é não, não podemos fazer isso sempre. Esse método de solução de série nem sempre 
funcionará. 


Singularidades Regulares e Irregulares 


O sucesso do método de substituição de série depende das raízes da equação indicial e do grau de singularidade dos 
coeficientes na equação diferencial. Para entender melhor o efeito dos coeficientes da equação nessa abordagem 
ingênua de substituição de série, considere quatro equações simples: 


6 
y” — -y =0, (9.110a) 
£ 
6 
y” — -5y =0, (9.110b) 
T 
1 2 
y" +=y' -Žu =0, (9.110c) 
x x 
1 2 
"+ Sy — Ty =0. (9.110d) 
T £ 


O leitor pode mostrar com facilidade que, para a Equação (9.110a), a equação indicial é 
k -k-6=0, 


resultando em k = 3, —2. Visto que a equação é homogênea em x (contando d? /dx? como x 2), não há nenhuma 
relação de recorrência. Contudo, ficamos com duas soluções perfeitamente boas, x? e x 2. 

A Equação (9.110b) difere da Equação (9.110a) por somente uma potência de x, mas isso envia a equação 
indicial a 

—6ao = 0, 

sem absolutamente nenhuma solução, porque concordamos que ao # 0. Nossa substituição de série funcionou 
para a Equação (9.110a), que tinha só uma singularidade regular, mas não para a Equação (9.110b), que tem um 
ponto singular irregular na origem. 

Continuando com a Equação (9.110c), adicionamos um termo y'/x. A equação indicial é 

k? —@? =0, 

mas, novamente, não há nenhuma relação de recorrência. As soluções são y = x7, x71, ambas séries de um único 
termo, perfeitamente aceitáveis. 

Quando mudamos a potência de x no coeficiente de y’ de —1, para —2, Equação (9.110d), há uma drástica 
mudança na solução. A equação indicial (com apenas o termo y’ contribuindo) se torna 


k = 0. 


Há uma relação de recorrência, 
a -jj -1) 
j+1 ` 


A menos que o parâmetro a seja selecionado para fazer com que a série termine, temos 


Aj+1 = +aj 


; (541 
lim e) lim 10 +1) 
j>00 | aj j>o j+1 
-2 
= lim 1 = 00. 
J>00 J 


Daí, nossa solução de série diverge para todo x + 0. Mais uma vez, nosso método funcionou para a 
Equação (9.110c) com uma singularidade regular, mas falhou quando tínhamos a singularidade irregular da 
Equação (9.110d). 
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Teorema de Fuchs 


A resposta à pergunta básica, quando podemos esperar que o método de substituição de série funcione, é dada pelo 
teorema de Fuchs, que afirma que sempre podemos obter ao menos uma solução de série de potências, contanto 
que estejamos expandindo em torno de um ponto que é um ponto ordinário ou, na pior das hipóteses, um ponto 
singular regular. 

Se tentarmos uma expansão em torno de uma singularidade irregular ou essencial, nosso método pode 
falhar, como falhou para as Equações (9.110b) e (9.110d). Felizmente, as equações mais importantes da Física 
Matemática, listadas na Seção 9.4, não têm nenhuma singularidade irregular no plano finito. Uma discussão mais 
detalhada do teorema de Fuchs aparece na Seção 9.6. 

Pela Tabela 9.4, Seção 9.4, o infinito é visto como um ponto singular para todas as equações consideradas. Para 
ilustrar ainda melhor o teorema de Fuchs, a equação de Legendre (tendo infinito como uma singularidade regular) 
tem uma solução de série convergente em potências negativas do argumento (Seção 12.10). Ao contrário, a equação 
de Bessel (com uma singularidade irregular no infinito) resulta em séries assintóticas (Seções 5.10 e 11.6). Essas 
soluções assintóticas são de extrema utilidade. 


Resumo 


Se estivermos expandindo em torno de um ponto ordinário ou, na pior das hipóteses, em torno de uma singularidade 
regular, a abordagem de substituição de série resultará em pelo menos uma solução (teorema de Fuchs). 
Obter uma ou duas soluções distintas depende das raízes da equação indicial. 
1. Se as duas raízes da equação indicial forem iguais, podemos obter só uma solução por esse método de 
substituição de série. 
2. Se a diferença entre as duas raízes for um número não-inteiro, podem ser obtidas duas soluções independentes. 
3. Se a diferença entre as duas raízes for um número inteiro, a maior das duas resultará em uma solução. 


A menor raiz pode ou não dar uma solução, dependendo do comportamento dos coeficientes. Na equação do 
oscilador linear obtemos duas soluções; para a equação de Bessel, obtemos só uma solução. 

A utilidade da solução de série em termos do que é a solução (isto é, números) depende da rapidez de 
convergência da série e da disponibilidade dos coeficientes. Muitas EDOs não resultarão em relações de recorrência 
simples e atraentes para os coeficientes. Em geral, a série disponível provavelmente será útil para |x| (ou |x — xol) 
muito pequeno. Podemos utilizar computadores para determinar coeficientes adicionais de série usando uma 
linguagem simbólica como Mathematica,!? Maple,! ou Reduce.!* Entretanto, para trabalho numérico, muitas 
vezes o melhor será a integração numérica direta. 


Exercícios 


9.5.1 Teorema da unicidade. A função y(x) satisfaz uma equação diferencial linear homogênea de 
segunda ordem. Em x = xo, y(x) = yo e dy/dx = yy. Mostre que y(x) é única e que nenhuma 
outra solução dessa equação diferencial passa pelos pontos (xo, Yo) com uma inclinação de yo. 
Sugestão: Admita que uma segunda solução satisfaça essas condições e compare com as expansões 
da série de Taylor. 


9.5.2 Tentou-se uma solução de série da Equação (9.80) por expansão em torno do ponto x = xo. Se xo 
é um ponto ordinário, mostre que a equação indicial tem raízes k = 0, 1. 

9.5.3 No desenvolvimento de uma solução de série da equação do oscilador harmônico simples (OHS), 
o segundo coeficiente da série ay foi desprezado exceto para o igualar a zero. Desenvolva uma 


segunda equação do tipo indicial a partir do coeficiente da próxima potência mais baixa de x, "1, 


(a) (equação OHS com k = 0). Mostre que se pode atribuir qualquer valor finito a a; (incluindo 
zero). 
(b) (equação OHS com k = 1). Mostre que a; deve ser igualado a zero. 


9.5.4 Analise as soluções de série das seguintes equações diferenciais para ver quando aı pode ser 
igualado a zero sem que nada seja irrevogavelmente perdido e quando a; deve ser igualado a zero. 
(a) Legendre, (b) Chebyshev, (c) Bessel, (d) Hermite. 


12S, Wolfram, Mathematica, A System for Doing Mathematics by Computer, Nova York: Addison Wesley (1991). 
BA, Heck, Introduction to Maple, Nova York: Springer (1993). 
14G. Rayna, Reduce Software for Algebraic Computation, Nova York: Springer (1987). 
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Resposta: (a) Legendre, (b) Chebyshev e (d) Hermite: Para k = 0, ay 
pode ser igualado a zero; para k = 1, a1, deve ser igualado 
a zero. 
(c) Bessel: ay deve ser igualado a zero (exceto para 
1 
k= n= —5). 
9.5.5 Resolva a equação de Legendre 
(1-2)y" — 2ry' +n(n+Dy=0 
por substituição direta de série. 
(a) Verifique que a equação indicial é 
k(k — 1) = 0. 
(b) Usando k = 0, obtenha uma série de potências pares de x (ay = 0). 
n(n+1 n(n — 2)(n + 1)(n +3 
Yar = aofi sa + X a K ta 
em que 
o GA D -nnt 
19 = : : x 
g GDG) 7 
(c) Usando k = 1, desenvolva uma série de potências ímpares de x (a, = 1). 
(n= D(n+29)  (n-—1)(n-—3)(n+2) (n+ 4) 
Yímpar = a E 31 z3 + 5! q? + ... ; 
onde f l 
(4 + D(j +2) — n(n + 1) 
aj+2 = m E Qj. 
(i +2) (j + 3) 

(d) Mostre que ambas as soluções, ypar e Vimpar» divergem para x = +1 se a série continuar até 
o infinito. 

(e) Por fim, mostre que, por uma escolha adequada de n, uma série por vez pode ser convertida em 
um polinômio, evitando assim a catástrofe da divergência. Em Mecânica Quântica essa restrição 
de n a valores inteiros corresponde à quantização do momento angular. 

9.5.6 Desenvolva soluções de série para a equação diferencial de Hermite 


(a) y” — 2xy' + 2ay = 0. 
Resposta: k(k — 1) = 0, equação indicial. 


Para k = 0, 
Aj4+2 = TÉDIO) (I); 
pe Ene] 
Para k = 1, 
a= 2r (ipa) 


(b) Mostre que ambas as soluções de série são convergentes para todo x, sendo que, para índices 
grandes, a razão entre coeficientes sucessivos se comporta como a razão correspondente na 
expansão de exp(x?2). 

(c) Mostre que, por escolha adequada de a, as soluções de série podem ser abreviadas e convertidas 
a polinômios finitos. (Esses polinômios, adequadamente normalizados, se tornam polinômios 
de Hermite na Seção 13.1.) 


ELSEVIER 
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9.5.7 


9.5.10 


9.5.11 


9.5.12 


9.5.13 


A EDO de Laguerre é 
xL! (x) + (1 — x)Li (£) + nLa(x) = 0. 


Desenvolva uma solução de série selecionando o parâmetro n para transformar sua série em um 
polinômio. 


Resolva e equação de Chebyshev 
(1 = °)TH — £T), +n°Tn =0, 


por substituição de série. Quais restrições são impostas a n se você exigir que a solução da série 
convirja para x = +1? 


Resposta: A série infinita realmente converge para x = +1 e não 
existe nenhuma restrição imposta a n (compare com o Exercício 5.2.16). 
Resolva 
(1 — 2?) U} (x) — 3U} (£) + n(n + 2)Un (£) = 0, 


escolhendo a raiz da equação indicial para obter uma série ímpar de potências de x. Uma vez que 
a série divergirá para x = 1, escolha n para convertê-la em um polinômio. 
k(k — 1) = 0. 
Para k = 1, 
G+DG+3) -nnt 
(+2) +3) r 


Obtenha uma solução de série da equação hipergeométrica 


Aj+2 = 


s(x — 1)y” + [(1 +a + b)z — cly’ + aby = 0. 


Teste sua solução para convergência. 


Obtenha duas soluções de série da equação hipergeométrica confluente 
xy” + (c — z)y' — ay = 0. 


Teste suas soluções para convergência. 


Uma análise baseada na Mecânica Quântica do efeito de Stark (coordenadas parabólicas) leva à 


equação diferencial 
d / du 1 m? lo 


Aqui, œ é uma constante de separação, E é a energia total e F é uma constante, em que F'z é a 
energia potencial acrescentada ao sistema pela introdução de um campo elétrico. Usando a maior 
raiz da equação indicial, desenvolva uma solução de série de potências em torno de € = 0. Avalie 
os três primeiros coeficientes em termos de ao. 


m2 


Equação indicial k? — a 0, 


Q 


uO = mer E E malet) 


Note que a perturbação F não aparece até a inclusão de ag. 


Para o caso especial de não haver nenhuma dependência azimutal, a análise de Mecânica Quântica 
do íon molecular do hidrogênio leva à equação 


d 


Llama Da 
K n’) | + au + sru =o. 


dn 


436 


“livro” — 2007/8/1 — 15:06 — page 436 — #446 


Física Matemática Arfken e Weber ELSEVIER 


9.5.14 


9.5.15 


9.5.16 


9.5.17 


9.5.18 


Desenvolva uma solução de série de potências para u(n). Avalie os três primeiros coeficientes que 
não desaparecem em termos de ao. 


Equação indicial k(k — 1) = 0, 


2— qa 2-a)(12—-a 
ui = and 14 TE t+ | o ) AA 


Para uma boa aproximação, a interação de dois núcleos pode ser descrita por um potencial mesônico 


v= Ae 
x 


atrativo para A negativo. Desenvolva uma solução de série da equação de onda de Schrödinger 


resultante. RR 
Y 
RR E-V)b=0 
2m dx? +( o 


através dos três coeficientes que não desaparecem. 
Y = agfa + 4 A'r? + SIGA” — E' asa +, 


em que “linha” indica multiplicação por 2m/R?. 
A energia potencial de um elétron próximo ao núcleo de um átomo complexo é dada por 
oZ e? 


V Pa br + bor?), 


em que os coeficientes bı e b2 surgem de efeitos de screening. Para o caso de momento angular 
zero, mostre que os três primeiros termos da solução da equação de Schrödinger têm a mesma 
forma que os do Exercício 9.5.14. Por translação adequada de coeficientes ou parâmetros, escreva 
os três primeiros termos em uma expansão de série da função de onda. 


Se o parâmetro a? na Equação (9.110d) for igual a 2, a Equação (9.110d) se torna 


Pela equação indicial e pela relação de recorrência, derive uma solução y = 1427 +22, Verifique 
que ela é de fato uma solução substituindo-a de volta na equação diferencial. 


A função modificada de Bessel To(a:) satisfaz a equação diferencial 
d 2 
q — To(a) + u— To(x) — a“ To(x) = 0. 
x z 


Pelo Exercício 7.3.4 verifica-se que o termo dominante em uma expansão assintótica é 


T 


Suponha uma série da forma 


e” 


To(x) gi v2nx 


{1 birt + boa? +- 


Determine os coeficientes b; e bz. 


Resposta: bı = z, bo = Tz 
A solução par da série de potências de equação de Legendre é dada pelo Exercício 9.5.5. Considere 
ao = 1 e n um inteiro que não seja par, digamos, n = 0, 5. Calcule as somas parciais da série através 
de 200 7400 600 2000 para z = 0,95(0,01)1,00. Além disso, escreva o termo individual 
correspondente a cada uma dessas potências. 
Nota: Esse cálculo não constitui prova de convergência em x = 0,99 ou divergência em x = 1,00, 
mas você talvez possa ver a diferença no comportamento da seqüência de somas parciais para esses 
dois valores de x. 
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9.5.19 (a) A solução ímpar da série de potências da Equação de Hermite é dada pelo Exercício 9.5.6. 
Considere ao = 1. Avalie essa série para œa = 0,1% = 1,2,3. Interrompa seu cálculo após 
o último termo calculado ter caído abaixo do termo máximo por um fator de 10º ou mais. 
Estabeleça um limite superior para o erro cometido por ignorar os termos restantes na série 
infinita. 
(b) Como verificação do cálculo da parte (a), mostre que a série de Hermite Ympar(o = 0) 


corresponde a fý exp(x?) dz. 
(c) Calcule essa integral para x = 1,2,3. 


9.6 Uma Segunda Solução 

Na Seção 9.5 foi desenvolvida uma solução de EDO homogênea de segunda ordem por substituição em uma série 
de potências. Pelo teorema de Fuchs isso é possível, contanto que a série de potências seja uma expansão ao redor 
de um ponto ordinário ou de uma singularidade não-essencial.!” Não há nenhuma garantia de que essa abordagem 
resultará nas duas soluções independentes que esperamos de uma EDO linear de segunda ordem. Na verdade, 
provaremos que tal EDO tem no máximo duas soluções linearmente independentes. De fato, a técnica rendeu 
somente uma solução para a equação de Bessel (n inteiro). Nesta seção também desenvolvemos dois métodos 
para obter uma segunda solução independente: um método integral e uma série de potências contendo um termo 
logarítmico. Contudo, em primeiro lugar consideramos a questão da independência de um conjunto de funções. 


Independência Linear de Soluções 
Dado um conjunto de funções y,, um critério para dependência linear é a existência de uma relação da forma 


XO kapa =0, (9.111) 
A 


na qual nem todos os coeficientes k» são zero. Por outro lado, se a única solução da Equação (9.111) é ka = 0 
para todo À, diz-se que o conjunto de funções y, é linearmente independente. 

Pensar na dependência linear de vetores pode ajudar. Considere A, B e C em espaço tridimensional, com 
A - B x C # 0. Nesse caso, não existe nenhuma relação não-trivial da forma 


aA +bB+cC=0 (9.112) 


A, B, e C são linearmente independentes. Por outro lado, qualquer quarto vetor, D, pode ser expresso como uma 
combinação linear de A, B e C (veja a Seção 3.1). Sempre podemos escrever a equação da forma 


D-aA -bB -cC=0, (9.113) 


e os quatro vetores não são linearmente independentes. Os três vetores não-coplanares A, B e C abrangem nosso 
espaço tridimensional real. 

Se um conjunto de vetores ou funções são mutuamente ortogonais, então são automaticamente linearmente 
independentes. Ortogonalidade implica independência linear. Isso pode ser demonstrado com facilidade 
considerando o os produtos internos (produto escalar ou produto interno para vetores, integral de ortogonalidade 
da Seção 10.2 para funções). 

Vamos admitir que as funções y, são diferenciáveis como necessário. Então, diferenciando a Equação (9.111) 
repetidas vezes, geramos um conjunto de equações 


XO kph =0, (9.114) 
A 

XO kat =0, (9.115) 
A 


e assim por diante. Isso nos dá um conjunto de equações lineares homogêneas no qual k» são as quantidades 
desconhecidas. Pela Seção 3.1 há uma solução ką # 0 somente se o determinante dos coeficientes dos k) 
desaparecer. Isso significa 


Pı Pa iii Pn 
já A ... 1 
O R mo oaen (9.116) 
pf» pf” To ptb) 


SÉ por isso que a classificação de singularidades na Seção 9.4 é de vital importância. 
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Esse determinante é denominado wronskiano. 

1. Se o wronskiano não for igual a zero, então a Equação (9.111) não tem nenhuma solução, exceto ka = 0. Por 
conseguinte, o conjunto de funções y, é linearmente independente. 

2. Se o wronskiano desaparecer em valores isolados do argumento, isso não prova necessariamente a dependência 
linear (a menos que o conjunto de funções tenha só duas funções). Contudo, se o wronskiano for zero sobre toda 
a faixa da variável, as funções y, são linearmente dependentes sobre essa faixa! (compare com o Exercício 
9.5.2 para o caso simples de duas funções). 


Exemplo 9.6.1 INDEPENDÊNCIA LINEAR 
As soluções da equação do oscilador linear (9.84) são yı = senwzx, Ya = cos wx. O wronskiano se torna 


senwx COS WT 
W COSWT —wWSsSEeEnwT 


= —w Ad. 


Por conseqüência, essas duas soluções, Yı € Y3, são linearmente independentes. Para apenas duas funções isso 
significa que não é um múltiplo da outra, o que é obviamente verdadeiro nesse caso. 
Você sabe que 


senwar = +(1 — cos? wr)’, 
mas essa não é uma relação linear da forma da Equação (9.111). 
Exemplos 9.6.2 DEPENDÊNCIA LINEAR 


Para ilustrar a dependência linear, considere as soluções da equação de difusão unidimensional. Temos y, = e” e 
Po = e7”, e adicionamos Y = cosh x, também uma solução. O wronskiano é 


© e? cosha 
—e” senha |=0. 
e” e” cosha 


O determinante desaparece para todo x porque a primeira e a terceira linhas são idênticas. Daí, e”, e77” e cosh x 
são linearmente dependentes e, de fato, temos uma relação da forma da Equação (9.111): 


e” +e — 2cosh gz = 0, com ky 0. 
E 
Agora estamos prontos para provar o teorema que diz que uma EDO homogênea de segunda ordem tem 
duas soluções linearmente independentes. 
Suponha que y1, Y2, y3 sejam três soluções da ODE homogênea (9.80). Então formamos o wronskiano 
Wik = YjYk — YjYk de qualquer par yj, yy delas e recordamos que W;, = y;yk — Y} yk. Dividimos cada EDO 
por y, obtendo —Q em seus lados direitos, portanto, 


" , n / 
& pi o(a 4 p%, 
Yj Yj Yk Yk 
Multiplicando por 4;%;., achamos 
(yjyk — Yj yr) + Plyy — Yzy) =0, ou jr = —PWok (9.117) 


para qualquer par de soluções. Por fim, avaliamos o wronskiano de todas as três soluções, expandido-o ao longo 
da segunda linha e usando as EDOs para o W;g: 


Yı Y2 Y3 
W=]| y y3 ys | =~-y1W23 + y2Wis — y3Wi2 

t- ZA ZA 

Yı Y2 Y3 
Yı Y2 Ya 

= P(y W23 — y2W13 + y3W12)= -P| y y2 y3 |=0. 

1 1 1 
Yı Vo Ya 


!6Compare com H. Lass, Elements of Pure and Applied Mathematics, Nova York: McGraw-Hill (1957), p. 187, para prova dessa asserção. 
Admite-se que as funções têm derivadas contínuas e que no mínimo um dos menores da linha de baixo da Equação (9.116) (expansão de 
Laplace) não desaparece em [a, b], o intervalo que está em consideração. 
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O wronskiano que se anula, W = 0, por causa de duas linhas idênticas, é exatamente a condição para dependência 
linear das soluções yj. Assim, há no máximo duas soluções linearmente independentes da EDO homogênea. De 
modo semelhante, podemos provar que uma EDO linear homogênea de enésima ordem tem n soluções linearmente 
independentes y;, portanto a solução geral y(x) = X- c;y;(x) é uma combinação linear delas. 


Uma Segunda Solução 
Voltando à nossa EDO linear homogênea de segunda ordem da forma geral 


y” + P(z)y' + Q(x)y =0, (9.118) 
sejam yı € y2 duas soluções independentes. Então, por definição, o wronskiano é 
W = yiya — yya- (9.119) 
Diferenciando o wronskiano, obtemos 
W' = yiya + Y1Y3 — Y1 Y2 — vivo 
= yı |[-P(2)y, — Q(e)yo) — y2|-P(2)y; — Q(x)n] 
= —P(x)(yiyo — Y192)- 


A expressão entre parênteses é exatamente W, o wronskiano, e temos 


W' =-P()W. (9.120) 
No caso especial em que P(x) = 0, isto é, 
y” + Q(x)y =0, (9.121) 
o wronskiano 
W = yiyh — y1 y2 = constante. (9.122) 


Visto que nossa equação diferencial original é homogênea, podemos multiplicar as soluções yı e yz por quaisquer 
constantes que desejarmos e organizar para que o wronskiano seja igual à unidade (ou —1). Esse caso, P(x) = 0, 
aparece com mais freqiiência do que poderíamos esperar. Lembre-se de que a porção de V? ( £) em coordenadas 
polares esféricas que envolve derivadas radiais não contém nenhuma derivada radial de primeira ordem. Por 
fim, toda equação diferencial linear de segunda ordem pode ser transformada em uma equação da forma da 
Equação (9.121) (compare com o Exercício 9.6.11). 

Para o caso geral, agora vamos admitir que temos uma solução da Equação (9.118) por uma substituição de 
série (ou por suposição). Passamos agora a desenvolver uma segunda solução, independente, para a qual W 0. 
Reescrevendo a Equação (9.120) como, 


dW 
wW =P dz, 
integramos sobre a variável x, de a a x, para obter 
W(x) É 
l es P d 
n W(a) I (x1) dz1, 


ou 
W(x) = W (a) exp |- a P(a1) dn] ; (9.123) 
Mas 
$ F d 
W(x) = ny, — yiy2 = vii (2) (9.124) 


Combinando as equações (9.123) e (9.124), temos 
d (=) = Wa) exp[— S: P(x1) dz] 


y? 


yı 


: (9.125) 


dx 


ge P(x) permanecer finita no domínio de interesse, W (x) £ 0, menos que W (a) = 0. Isto é, o wronskiano de nossas duas soluções ou 
é identicamente igual a zero ou nunca é zero. Contudo, se P(x) não permanecer finita em nosso intervalo, então W (x) pode ter zeros isolados 
naquele domínio e devemos ter cuidado para escolher a, de modo que W (a) Æ 0. 
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Por fim, integrando a Equação (9.125) de £2 = ba £2 = x, obtemos 


“ expl- [2 P(xı)dzı] 
sela) = nlo)W(a) f es 
b lu: (x2)] 
Aqui, a e b são constantes arbitrárias e um termo yı(x)y2(b)/yı(b) foi descartado porque não leva a nada de 
novo. Uma vez que W (a), o wronskiano avaliado em « = a, é uma constante e nossas soluções para a equação 
diferencial homogênea sempre contêm um fator normalizador desconhecido, fazemos W (a) = 1 e escrevemos 


do. (9.126) 


? expl- [2 P(x1) dai] 
[yı (22)]? 


Note que os limites inferiores xı = a e £2 = b foram omitidos. Se fossem conservados, simplesmente dariam 
uma contribuição igual a uma constante vezes a primeira solução conhecida, y (1), e, por conseguinte, nada 
acrescentariam de novo. Se tivermos o importante caso especial de P(x) = 0, a Equação (9.127) se reduz a 


dão. (9.127) 


na) =ne) f 


das 


y2(x) = yı (x) T AAR (9.128) 


Isso significa que, usando a Equação (9.127) ou a Equação (9.128), podemos tomar uma solução conhecida e, por 
integração, gerar uma segunda solução independente da Equação (9.118). Essa técnica é usada na Seção 12.10 para 
gerar uma segunda solução da equação diferencial de Legendre. 


Exemplo 9.6.3 UMA SEGUNDA SOLUÇÃO PARA A EQUAÇÃO DO OSCILADOR LINEAR 
Por d?y/dx? + y = 0, com P(x) = 0, seja uma solução de yı = seng. Aplicando a Equação (9.128), obtemos 


x 

d 

vala) = seno f a = senx(—cotgx) = — cosa, 
sen? z2 


que é claramente independente (não um múltiplo linear) de senz. E 


Forma de Série da Segunda Solução 

A seguinte seqiiência de operações pode nos dar uma idéia melhor da natureza da segunda solução de nossa equação 
diferencial. 

1. Expresse P(x) e Q(x) na Equação (9.118) como 


oO OO 
PS p, Q= Ss qe (9.129) 
i=-1 j=-2 
Os limites mais baixos dos somatórios são selecionados para criar a singularidade regular mais forte possível 
(na origem). Essas condições satisfazem exatamente o teorema de Fuchs e assim nos ajudam a entender melhor 
esse teorema. 
2. Desenvolva alguns dos primeiros termos de uma solução de série de potências, como na Seção 9.5. 
3. Usando essa solução como yı, obtenha uma segunda solução do tipo de série, y2, com a Equação (9.127), 
integrando termo a termo. 


Passando para a etapa 1, temos 


1 


y” + (par! + po + pixs +- Jy + (quo + qua! +. )y =0, (9.130) 


na qual o ponto x = 0, na pior das hipóteses, é um ponto singular regular. Sep 4 = q-1 = q-2 = 0, ele se reduz 
a um ponto ordinário. Substituindo 
OO 
k+A 
y=) ar" 
A=0 


(etapa 2), obtemos 


NOAE A- Dae XO pis XO (k + Ajang" tA! 
A=0 i=—1 A=0 
+Y goi aat =o. (9.131) 
j=-2 A=0 
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Admitindo que p—ı Æ 0,q-2 # 0, nossa equação indicial é 
k(k-D+pak+go=0, 


2 


que estabelece o coeficiente líquido de x*—2 como igual a zero. A expressão reduz a expressão a 


k? + (p-1 — 1)k + q-2 = 0. (9.132) 


Denotamos as duas raízes dessa equação indicial por k = a e k = a — n, em que n é zero ou um inteiro positivo. 
(Se n não for um inteiro, esperamos duas soluções de série independentes pelos métodos da Seção 9.5 e pronto). 
Então, 

(k-o)(k-a+n)=0, (9.133) 


ou 
k+(n-20)k+a(a-—n)=0, 


e igualando coeficientes de k nas Equações (9.132) e (9.133), temos 
p-si—1l=n-—2a. (9.134) 


A solução de série conhecida correspondente à raiz maior k = a pode ser escrita como 


oo 
yi = a > at. 
A=0 


Substituindo essa solução de série na Equação (9.127) (etapa 3), deparamos-nos com 


7 exp(- Ja Din pit das) 
yo(x) = næ f aa data, (9.135) 
2330 022)? 
em que as soluções yı e y> foram normalizadas, de modo que o wronskiano W(a) = 1. Atacando o fator 
exponencial em primeiro lugar, temos 
> Pk rkt! 
a Èra dx = p—1ı ln z2 + x q É fla) (9.136) 


sendo f(a) uma constante de integração que pode depender de a. Por conseqüência, 


(9.137) 


Essa expansão de série final da exponencial certamente é convergente se a expansão original do coeficiente P(x) 
for uniformemente convergente. 
O denominador na Equação (9.135) pode ser manipulado escrevendo-se 


a 274 —1 es = 
(E out) | = as Srana) = = 252055 D (9.138) 
A=0 A=0 A=0 


Desprezando fatores constantes que de qualquer modo serão apanhados pela imposição de W(a) = 1, obtemos 


y2(x) =ne) [ a 2" a(S ea) dao. (9.139) 


“livro” — 2007/81 — 15:06 — page 442 — #452 


442 Física Matemática Arfken e Weber ELSEVIER 


Pela Equação (9.134), 2 
E a (9.140) 


e aqui admitimos que n é um inteiro. Substituindo esse resultado na Equação (9.139), obtemos 


ya(x) = yı (x) / (coxs "reg" + cor". + emo! +: ) dzz. (9.141) 


A integração indicada na Equação (9.141) leva a um coeficiente yı (x) que consiste em duas partes: 


1. Uma série de potências começando com x”. 


2. Um termo logarítmico da integração de x”! (quando À = n). Esse termo sempre aparece quando n é um inteiro, 
a menos que cn desapareça. !8 


Exemplo 9.6.4 UMA SEGUNDA SOLUÇÃO DA EQUAÇÃO DE BESSEL 
Pela equação de Bessel, equação (9.100) (dividida por x? para ficar de acordo com a Equação (9.118)), temos 
P(x) = x7! Q(x)=1 para o caso de n = 0. 
Daí, p-1 = 1, go = 1; todos os outros p; e q; desaparecem. A equação indicial de Bessel é 
k’ =0 


(Equação (9.103) com n = 0). Por conseguinte, verificamos as Equações (9.132) a (9.134) com n e a = 0. 
Nossa primeira solução está disponível pela Equação (9.108). Dando-lhe um novo rótulo para ficar de acordo 
com o Capítulo 11 (e usando ag = 1), obtemos! 


a rg 
y(x) = Jols) = 1 — = + = — O(aº). (9.142a) 
4 64 
Agora, substituindo tudo isso na Equação (9.127), temos o caso específico correspondente à Equação (9.135): 
exp|- f” xI" da] 
1 — 12/44 24/64 — ...)2 


ya(a) = Jo(a) É i das. (9.142b) 


Pelo numerador do integrando, 


sa dzı 1 
exp|— E [a exp[- In z2] = E 


2 


Isso corresponde ao x; ””* na Equação (9.137). Do denominador do integrando, usando uma expansão binomial, 
obtemos 3 
r? go] t 5x 
e | RR 
| 4 + A iz 2 K 32 X 
Correspondente à Equação (9.139), temos 
71 xr? 5r 
= 1 2 2 nal d 
po = do(a) f ht Gs |an 
2 5 4 
= duto) (ua e (9.142€) 


Vamos verificar esse resultado. Pelas Equações (11.62) e (11.64), que dão a forma padrão da segunda solução 
(são necessários termos de ordens mais altas), 


2 


2 2 $ 
No(x) = -[ln z — ln 2 + 9]Jo(x) + — P dia i (9.142d) 
T T| 4 128 


Surgem dois pontos: (1) uma vez que a equação de Bessel é homogênea, podemos multiplicar y2(x) por qualquer 
constante. Para ficar compatível com No(x), multiplicamos nosso y2(x) por 2/7. (2) Para nossa segunda solução, 


!8Para considerações de paridade, consideramos que In x é In |x|, par. 
190 O maiúsculo (ordem de) como escrito aqui significa termos proporcionais a zê e possivelmente potências mais altas de z. 
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(2/n)ya(x), podemos adicionar qualquer constante múltipla da primeira solução. Mais uma vez, para ficar 
compatível com No(x:), adicionamos 


Z m2 +alle), 


onde y é a constante de Euler-Mascheroni usual (Seção 5.2).2º Nossa nova segunda solução modificada é 


2 2 2 5a! 
vala) = [ng -m2 +49] Jo(x) + Jole)? Z + Ep (9.142e) 
T T 4 128 


Agora, a comparação com No(x) se torna uma simples multiplicação de Jo(x) da Equação (9.142a) e da chave da 
Equação (9.142c). A multiplicação confere, por meio dos termos de ordem z? e x4, que é tudo o que transportamos. 
Nossa segunda solução pelas Equações (9.127) e (9.135) está de acordo com a segunda solução padrão, a função 
de Neumann, No(a). 

Pela análise precedente, a segunda solução da Equação (9.118), y2(x), pode ser escrita como 


ya(x) = (x) Ina + yo djxite, (9.142f) 


j==n 


a primeira solução vezes In x e uma outra série de potências, esta começando com x®7”, o que significa que 
podemos procurar um termo logarítmico quando a equação indicial da Seção 9.5 der apenas uma solução de série. 
Com a forma da segunda solução especificada pela Equação (9.1421), podemos substituir a Equação (9.142f) na 
equação diferencial original e determinar os coeficientes d; exatamente como na Seção 9.5. Talvez valha a pena 
notar que não é necessária nenhuma expansão de série de In x. In x será descartado na substituição; suas derivadas 
sobreviverão. E 


A segunda solução usualmente divergirá na origem por causa do fator logarítmico e das potências negativas de x 
na série. Por essa razão, y> (1) normalmente é denominada solução irregular. A primeira solução de série, yı (x), 
que usualmente converge na origem, é denominada solução regular. A questão do comportamento na origem é 
discutida com mais detalhes nos Capítulos 11 e 12, nos quais voltamos às funções de Bessel, funções modificadas 
de Bessel e funções de Legendre. 


Resumo 
As duas soluções de ambas as seções (juntamente com os exercícios) dão uma solução completa de nossa EDO 
linear homogênea de segunda ordem — admitindo que o ponto de expansão não é pior do que uma singularidade 
regular. Ao menos uma solução sempre pode ser obtida por substituição de série (Seção 9.5). Uma segunda 
solução, linearmente independente, pode ser construída pela dupla integral wronskiana Equação (9.127). Isso é 
tudo: não existe nenhuma terceira solução linearmente independente (compare com o Exercício 9.6.10). 

A EDO linear não-homogênea, de segunda ordem terá uma solução adicional: solução particular. Essa 
solução particular pode ser obtida pelo método de variação de parâmetros, Exercício 9.6.25, ou por técnicas como 
a função de Green, Seção 9.7. 


Exercícios 
9.6.1 Você sabe que os três vetores unitários x, ŷ e Z são mutuamente perpendiculares (ortogonais). 
Mostre que $, y e Z são linearmente independentes. Especificamente, mostre que não existe 
nenhuma relação da forma da Equação (9.111) para $, y e Z. 


9.6.2 O critério para a independência linear de três vetores A, B e C é que a equação 
aA + bB+cC = 0 


(análoga à Equação (9.111)) não tenha nenhuma outra solução, exceto a trivial a = b = c=0. 
Usando componentes A = (A1, As, A3), e assim por diante, estabeleça o critério determinante 
para a existência ou não-existência de uma solução não-trivial para os coeficientes a, b e c. Mostre 
que seu critério é equivalente ao produto escalar triplo A - B x C Z 0. 


20A função de Neumann No é definida como é para conseguir propriedades assintóticas convenientes, Seções 11.3 e 11.6. 
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9.6.3 


9.6.4 


9.6.5 


9.6.6 


9.6.7 


9.6.8 


9.6.9 


Usando o determinante wronskiano, mostre que o conjunto de funções 


é linearmente independente. 


Se o wronskiano de duas funções yı e y2 é identicamente zero, mostre por integração direta que 


Yı = Y2, 


isto é, que yı € y2 são dependentes. Admita que as funções têm derivadas contínuas e que ao menos 
uma das funções não desaparece no intervalo considerado. 


Constata-se que o wronskiano de duas funções é zero em xo — € < x < zo + € para c > 0 
arbitrariamente pequeno. Mostre que esse wronskiano desaparece para todo x e que as funções são 
linearmente dependentes. 
As três funções senz, e”, e e ” são linearmente independentes. Não é possível escrever nenhuma 
função como uma combinação linear das outras duas. Mostre que o wronskiano de senz, e”, e e” 
desaparece, mas somente em pontos isolados. 
Resposta: W = 4seng, 
W = 0 para x = Enr, m= 0l 2y 


Considere duas funções yı = ve, = |x| = z sgn z (Figura 9.3). A função sgn 7z é o sinal de zx. 
Uma vez que y} = 1 e y = sgn x, W (p1, 2) = 0 para qualquer intervalo, incluindo [—1, +1]. 
O desaparecimento do wronskiano em |—1, +1] prova que y, e p, são linearmente dependentes? É 
claro que não são. O que está errado? 


i P2 


Figura 9.3: x e |x|. 


Explique que a independência linear não significa a ausência de qualquer dependência. Ilustre seu 
argumento com cosh z e e”. 


A equação diferencial de Legendre 
(1-2)y" — 2xy' +n(n+1)y=0 


tem uma solução regular P, (x) e uma solução irregular Qn(x). Mostre que o wronskiano de P, e 
Qn é dado por 
An 

2 A 


l-r 


Pa (2)Qn (2) — Pa (2)Qn (2) = 


ELSEVIER 
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9.6.10 


9.6.11 


9.6.12 


9.6.13 


9.6.14 


9.6.15 


9.6.16 


com A, independente de x. 


Mostre, por meio do wronskiano, que uma EDO linear homogênea de segunda ordem da forma 
y” (2) + P(a)y'(a) + Q(a)yla) = 0 


não pode ter três soluções independentes. (Admita uma terceira solução e mostre que o 
wronskiano desaparece para todo x.) 


Transforme nossa EDO linear de segunda ordem 


y” + P(x)y' + Q(x)y = 0 


sra [ roi 


e mostre que a equação diferencial resultante para z é 


pela substituição 


z” +q(x)z =0, 


em que 
qlz) = Q(x) — 3P" (£) — 4P2(a). 
Nota: Essa substituição pode ser derivada pela técnica do Exercício 9.6.24. 


Use o resultado do Exercício 9.6.11 para mostrar que se pode esperar que a substituição de y(r) por 
rọ(r) elimine a derivada de primeira ordem do laplaciano em coordenadas polares esféricas. Veja 
também o Exercício 2.5.18(b). 


Por diferenciação direta e substituição, mostre que 


d po) _ [A af(x,a) dh(a) Ba 
da Ja 10925 ' o oe d+ Ilma) a) O 
Na equação 


yı (x) satisfaz 
yi + Play + Q(z)yı =0. 
A função y2(x) é uma segunda solução linearmente independente da mesma equação. Mostre que 


a inclusão de limites inferiores nas duas integrais não leva a nada de novo, isto é, apenas gera um 
fator constante global e uma constante que é um múltiplo da solução conhecida y (x). 


Dado que uma solução de 
I 1 1 m? 
R +-R —-—R=0 
r r 
é R = r™, mostre que a Equação (9.127) prevê uma segunda solução, R = r7™. 


Usando yı (x) = Xp _o(—1)” z?” +! /(2n + 1)! como uma solução da equação do oscilador linear, 
siga a análise que culminou na Equação (9.142f) e mostre que cı = 0, de modo que, nesse caso, a 
segunda solução não contém um termo logarítmico. 
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9.6.17 — Mostre que, quando n não é um inteiro na EDO de Bessel, Equação (9.100), a segunda solução da 
equação de Bessel, obtida pela Equação (9.127), não contém um termo logarítmico. 
9.6.18 | (a) Uma solução da equação diferencial de Hermite 
y” — 2zy' +20y=0 
para aœ = 0 é yı (x) = 1. Ache uma segunda solução, y2(x), usando a Equação (9.127). Mostre 
que sua segunda solução é equivalente a Yímpar (Exercício 9.5.6). 
(b) Ache uma segunda solução para a = 1, em que yı (x) = x, usando a Equação (9.127). Mostre 
que sua segunda solução é equivalente a ypar (Exercício 9.5.6). 
9.6.19 Uma solução da equação diferencial de Laguerre 
xy” +(1-2)y +ny=0 
para n = 0 é yı (x) = 1. Usando a Equação (9.127), desenvolva uma segunda solução, linearmente 
independente. Exiba explicitamente o termo logarítmico. 
9.6.20 Para a equação de Laguerre com n = 0, 
x es 
vala) = I — ds. 
s 
(a) Escreva y>(x:) como um logaritmo mais uma série de potências. 
(b) Verifique que a forma integral de y2(x), dada anteriormente, é uma solução da equação de 
Laguerre (n = 0) por diferenciação direta da integral e substituição na equação diferencial. 
(c) Verifique que a forma de série de y2(x), parte (a), é uma solução diferenciando a série e a 
substituindo de volta na equação de Laguerre. 
9.6.21 | Uma solução da equação de Chebyshev 
(1 — ey” -ry +nºy=0 
paran=0é6y=1. 
(a) Usando a Equação (9.127), desenvolva uma segunda solução, linearmente independente. 
(b) Ache uma segunda solução por integração direta da equação de Chebyshev. 
Sugestão: Faça v = y' e integre. Compare seu resultado com a segunda solução dada na Seção 13.3. 
Resposta: (a) y2 = sen lg. 
(b) A segunda solução, V, (x), não é definida para n = 0. 
9.6.22 Uma solução da equação de Chebyshev 
(1 — z?’)y” — ry +nºy=0 
para n = 1 é yı (x) = x. Estabeleça a solução de dupla integral wronskiana e derive uma segunda 
solução, yo (a). 
Resposta: y2 = —(1 — z3), 
9.6.23 A equação de onda radial de Schrödinger tem a forma 


i Ea +I(L+1) E +V(r)|y(r) = Ey(r). 


-2m dr? 2mr? 
A energia potencial V (r) pode ser expandida em torno da origem como 


b. 
V(r) =" +b tbr +. 


(a) Mostre que há uma solução (regular) começando com r!+t, 
(b) Pela Equação (9.128), mostre que a solução irregular diverge na origem quando r~’. 
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9.6.24 Mostre que, se admitirmos que a segunda solução, y2, tem a forma yo (x) = yi(x) f(x), substituí-la 
de volta na equação original 
yo + P(a)yo + Q(z)y2 =0 


L frei S Pdi a, 
ra=] Puo 


leva a 


de acordo com a Equação (9.127). 
9.6.25 Se nossa EDO linear de segunda ordem for não-homogênea, isto é, da forma da Equação (9.82), a 
solução mais geral é 
y(x) = y(x) + gola) + yp(2). 
(yı € y2 são soluções independentes da equação homogênea.) 
Mostre que 


7 an(s)F(s) ds pd ? yols)F(s) ds 
Wign(s), y2(s)} Wiw(s), ya(s)H 


com W(y(x), y2(x)} o wronskiano de y; (s) e yo(s). 
Sugestão: Assim como no Exercício 9.6.24, faça yp(x) = yı(x)v(x) e desenvolva uma equação 
diferencial de primeira ordem para v’ (x). 


9.6.26 (a) Mostre que 


Yp(x) = ya(x) 


tem duas soluções: 
y(x) = aoz t2, 
valo) = az=), 


(b) Para a = 0, as duas soluções linearmente independentes da parte (a) se reduzem a y10 = agr” 2 
Usando a Equação (9.128), derive uma segunda solução, 


yo(x) = aox? In z. 


Verifique que y20 é, de fato, uma solução. 
(c) Mostre que a segunda solução da parte (b) pode ser obtida como um caso-limite pelas duas 


soluções da parte (a): 
yzo(x) = lim (=+) 


a—0 Q 


9.7 Equação Não-Homogênea — Função de Green 
A substituição de série da Seção 9.5 e a dupla integral wronskiana da Seção 9.6 dão a solução mais geral da 
EDO linear homogênea de segunda ordem. A solução específica, yp, linearmente dependente do termo fonte 
(F(x) da Equação (9.82)) pode ser extraída pelo método de variação de parâmetros, Exercício 9.6.25. Nesta seção, 
recorremos a um método de solução diferente — a função de Green. 

Uma analogia eletrostática é muito útil para uma breve introdução ao método da função de Green, como aplicado 
à solução da EDP não-homogênea. Na presença de cargas, o potencial eletrostático % satisfaz a equação não- 
homogênea de Poisson (compare com a Seção 1.14), 


V?y = E (unidades mks), (9.143) 
0 


e a equação homogênea de Laplace, 
V2p=0, (9.144) 


na ausência de carga elétrica (p = 0). Se as cargas forem cargas pontuais q;, sabemos que a solução é 


1 r 
p= 5» no (9.145) 


ÅTE0 
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uma superposição de soluções de carga aplicada a um ponto único obtida pela lei de Coulomb para a força entre 
duas cargas pontuais qı € q2, 
— nat 
— Aregr?” 


(9.146) 


Por substituição das cargas pontuais discretas por uma carga distribuída da forma espalhada, a densidade de carga 
p, Equação (9.145), se torna 
1 foro, 


=0)= — | — .147 
y(r = 0) Ei a £ (9.147) 
ou, para o potencial em r = r; distante da origem e da carga em r = ro, 
1 
ylrı) = j; pla) drs, (9.148) 
ÅTE0 |rı ER r2] 


Usamos % como o potencial correspondente à distribuição de carga dada e, por conseguinte, satisfazemos a equação 
de Poisson (9.143). Entretanto, para satisfazer a equação de Poisson com uma fonte pontual no ponto definido por 
r2, precisamos de uma função G, que denominamos função de Green: 


V?G = —ô(rı — r2). (9.149) 


Então, em termo físicos, G é o potencial em rı correspondente a uma fonte unitária em r2. Pelo teorema de Green 
(Seção 1.11, Equação (11.104)), 


feve — GV) dra = five — GV) do. (9.150) 


Admitindo que o integrando caia mais rapidamente do que 72, podemos simplificar nosso problema considerando 
o volume tão grande que a integral de superfície desaparece, deixando 


[aa = f GV? dra, (9.151) 


ou, por substituição nas Equações (9.143) e (9.149), temos 


- f veil — r2) drz = [EE ar, (9.152) 


A integração empregando a propriedade definidora da função delta de Dirac (Equação (1.171b)) resulta em 


y(r) = = J Glrusrao(ra) dra (9.153) 


Note que usamos a Equação (9.149) para eliminar V 2G, mas que a função G em si ainda é desconhecida. Na 
Seção 1.14, lei de Gauss, constatamos que 


2 1 = 0, 
fy G) dr = ( Sm (9.154) 


0, se o volume não incluir a origem, e —47, se a origem for incluída. Esse resultado da Seção 1.14 pode ser reescrito 
como na Equação (1.170), ou 


vi E ) =, ou vi E e ô(ry — rə), (9.155) 


477 4rri2 


que corresponde a um deslocamento da carga eletrostática desde a origem até a posição r = ra. Aqui, r2 = 
|rı — ro], e a função delta de Dirac ó(r, — rs) desaparece, a menos que rı = rz. Por conseguinte, comparando as 
Equações (9.149) e (9.155), a função G (função de Green) é dada por 

1 


G(ri,12) = Irri — ral (9.156) 
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A solução de nossa equação diferencial (equação de Poisson) é 


1 p(r2) 
ÅTE0 [E — rol 


y(r) = dra, (9.157) 
em total concordância com a Equação (9.148). Na verdade, (rı), Equação (9.157), é a solução particular da 
equação de Poisson. Podemos adicionar soluções da equação de Laplace (compare com Equação (9.83)). Tais 
soluções poderiam descrever um campo externo. 

Esses resultados serão generalizados para a equação diferencial linear de segunda ordem, mas não-homogênea 


Ly(ri) = —f(ri), (9.158) 


em que £ é um operador diferencial linear. A função de Green é considerada uma solução de 


LG(r1, r2) = —ô(rı E r2), (9.159) 


análoga à Equação (9.149). A função de Green depende de condições de contorno que podem não ser mais aquelas 
da eletrostática em uma região de extensão infinita. Então, a solução particular y(r1) se torna 


y(rı) = f Glera) f(e) dra (9.160) 


(Também pode haver uma integral sobre uma superfície limitadora, dependendo das condições especificadas.) 

Resumindo, de modo mais geral a função de Green, que costuma ser escrita G(r1,r2) como um lembrete de 
seu nome, é uma solução da Equação (9.149) ou da Equação (9.159). Ela entra em uma solução integral de nossa 
equação diferencial, como nas equações (9.148) e (9.153). Para o caso simples porém importante da eletrostática, 
obtemos a função de Green, G(r4,r>), pela lei de Gauss, comparando as Equações (9.149) e (9.155). Por fim, 
pela solução final (Equação (9.157)), é possível desenvolver uma interpretação física da função de Green. Ela 
ocorre como uma função ponderadora ou função propagadora que acentua ou reduz o efeito do elemento de carga 
p(r2) dra, conforme sua distância do ponto de campo rı. A função de Green, G(x1, r2), dá o efeito de uma fonte 
pontual unitária em r> na produção de um potencial em rı. É assim que ela foi introduzida na Equação (9.149); 
é assim que ela aparece na Equação (9.157). 


Simetria da Função de Green 


Uma importante propriedade da função de Green é a simetria de suas duas variáveis, isto é, 
G(r1, r2) = G(r2,r1). (9.161) 


Embora seja óbvio no caso eletrostático que acabamos de considerar, isso pode ser provado sob condições mais 
gerais. No lugar da Equação (9.149), vamos impor que G(r, r1) satisfaça?! 


V - [pV G(r, r1)] +àq(r)G(r, r1) = —ô(r — rı), (9.162) 


correspondente a uma fonte pontual matemática em r = rı. Aqui, as funções p(r) e q(r) são bem-comportadas 
mas, por outro lado, são funções arbitrárias de r. A função de Green, G(r, r2), satisfaz a mesma equação, mas o 
índice inferior 1 é substituído pelo índice 2. As funções de Green, G(r, r1) e G(r, r2), têm os mesmos valores sobre 
uma dada superfície S de algum volume de extensão finita ou infinita, e suas derivadas normais têm os mesmos 
valores sobre a superfície © ou essas funções de Green se anulam em S (condições de contorno de Dirichlet, Seção 
9.1). 2 Então, G(r, r2) é uma espécie de potencial em r, criado por uma fonte pontual unitária em r3. 

Multiplicamos a equação para G(r, rı) por G(r, r2) e a equação para G(r, r2) por G(r,r1), e então subtraímos 
as duas: 


G(r,ro)V - [p(r)VG(r,rı)] — G(r, rı)V >- [p(r)VG(r,r2)] 
= —G(r,r2)ô(r — r1) + G(r, r1)ô(r — r2). (9.163) 


21 A Equação (9.162) é uma versão tridimensional não-homogênea da equação de autovalor auto-adjunta, Equação (10.8). 
2 Qualquer tentativa de exigir que as derivadas normais desapareçam na superfície (condições de Neumann, Seção 9.1) leva a problemas 
com a lei de Gauss. É como exigir que J E- do= 0 quando você sabe perfeitamente bem que há alguma carga elétrica dentro da superfície. 
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O primeiro termo na Equação (9.163), 
G(r,r2)V - [p(r)VG(r,r1)], 
pode ser substituído por 
V - [G(r,rə)p(r)V G(r, r1)] — VG(r, r2) -p(r)V G(r, r1). 


Uma transformação similar é executada no segundo termo. Então, integrando sobre o volume cuja superfície é S e 
usando o teorema de Green, obtemos uma integral de superfície 


feto) VGE; r1) = Clem )p(r)V te, ra) do 
S 

= —G(r1, r2) + G(r2,r1). (9.164) 
Os termos do lado direito aparecem quando usamos as funções delta de Dirac na Equação (9.163) e efetuamos a 
integração do volume. Com as condições de fronteira impostas anteriormente sobre a função de Green, a integral 


de superfície desaparece e 
G(r1, r2) = G(ra,r1), (9.165) 


que mostra que a função de Green é simétrica. Se as autofunções forem complexas, as condições de fronteira 
correspondentes às equações (10.19) a (10.20) são adequadas. A Equação (9.165) se torna 
G(r1, r2) = G*(r2,r1). (9.166) 


Note que essa propriedade de simetria vale para funções de Green em toda equação na forma da Equação (9.162). 
No Capítulo 10 daremos o nome de auto-adjuntas a equações dessa forma. A simetria é a base de vários teoremas 
de reciprocidade; o efeito de uma carga em rz sobre o potencial em rı é o mesmo que o efeito de uma carga em rı 
sobre o potencial em r3. 

Essa utilização de funções de Green é uma poderosa técnica para resolver muitos dos mais difíceis problemas 
da Física Matemática. 


Forma das Funções de Green 


Vamos admitir que £ seja um operador diferencial auto-adjunto da forma geral? 
Lı = Vic |p(r1)V1] +a(r). (9.167) 


Aqui, o índice 1 em £ acentua que £ opera sobre rı. Então, como uma simples generalização do teorema de Green, 
Equação (1.104), temos 


fota — ulov) dra = foovau — u Vov) - dos, (9.168) 


na qual todas as quantidades têm r como seu argumento. (Para verificar a Equação (9.168), tome a divergência 
do integrando da integral de superfície). Fazemos u(r2) = y(r>), de modo que a Equação (9.158) se aplica 
e v(r2) = G(r1,r2), de modo que a Equação (9.159) se aplica. (Lembre-se de que G(r1,r2) = G(ra,r1).) 
Substituindo no teorema de Green, obtemos 


ferro) fea) + vlade: = mo) ro 
= J PEGE) Vaule) — y(r2)V2G(r1,r2)} «dos. (9.169) 
Quando integramos sobre a função delta de Dirac 
lr) = f Glrisra) fra) dr 


+ folro tetra) Vau) = y(r2)V2G(r1, r2) } Ê dos, (9.170) 


23£1 pode estar em 1, 2 ou 3 dimensões (com interpretação adequada de V1). 
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nossa solução para a Equação (9.158) aparece como uma integral de volume mais uma integral de superfície. Se 

ambas, y e G, satisfazem as condições de contorno de Dirichlet ou se ambas satisfazem as condições de contorno 

de Neumann, a integral de superfície se anula e recuperamos a Equação (9.160). A integral de volume é uma 

integral ponderada sobre o termo de fonte f(r>) com nossa função de Green G (r1, r2) como a função ponderadora. 
Para o caso especial de p(r1) = 1 e q(r1) = 0, £ é V2, o laplaciano. Vamos integrar 


ViG(ri,r2) = —ô(rı — r2) (9.171) 


sobre um pequeno volume que inclui a fonte pontual. Então: 


Vi s VıG(rı, r2) dTı = - fse = r2) dT1 =-—1. (9.172) 


A integral de volume da esquerda pode ser transformada pelo teorema de Gauss, assim como no 
desenvolvimento da lei de Gauss, Seção 1.14. Constatamos que 


J Vicen) ; do1 ==]; (9.173) 


Diga-se de passagem que isso mostra que pode não ser possível impor uma condição de contorno de Neumann, 
que a derivada normal da função de Green, OG /Ən, desaparece em toda a superfície. 
Se estivermos em espaço tridimensional, a Equação (9.173) é satisfeita, tomando 


1 1 


o 
Cute) = ar jr 


riz 


Ti? = Im E ro|. (9.174) 


A integração é sobre a superfície de uma esfera com centro em r2. A integral da Equação (9.174) é 


1 1 


G ===" 9.175 
(£1, r2) 47 [rı — rof’ ( ) 
de acordo com a Seção 1.14. 
Se estivemos em espaço bidimensional, a Equação (9.173) é satisfeita, tomando 
o 1 1 
Gips ERER 2 (9.176) 
p12 (Pr P2) 27 py — pal 


sendo r substituído por p, p = (x? + y?) 2 e sendo a integração sobre a circunferência de um círculo com centro 


em pz. Aqui, p12 = | P1— Pa]. Integrando a Equação (9.176), obtemos 


1 
G(P1; P2) = “r ln |p; — pol. (9.177) 


Podemos adicionar a G(p1, p2) (e a G(r1,r2)) qualquer múltiplo da solução regular da equação homogênea 
(de Laplace), conforme necessário para satisfazer as condições de contorno. 

O comportamento da função de Green para o operador de Laplace na vizinhança da fonte pontual r} = r2 
mostrado pelas Equações (9.175) e (9.177) facilita a identificação das funções de Green para os outros casos, tais 
como a equação de Helmholtz e a equação modificada de Helmholtz. 

1. Parar, Æ r2, G(ry,r>) deve satisfazer a equação diferencial homogênea 


LıG(rı, r2) = 0, rı Æ ro. (9.178) 
2. À medida que rı > rə (ou p ı > P 2), 


1 
G(p1, Po) E EF ln |p; — ps|, espaço bidimensional, (9.179) 


1 1 
G(r1, r2) S —  ————, espaço tridimensional. (9.180) 
47 Ir = ra | 


O termo +k? no operador não afeta o comportamento de G perto do ponto singular r4 = r». Por conveniência, as 
funções de Green para os operadores de Laplace, de Helmholtz e de Helmholtz modificada estão relacionadas na 
Tabela 9.5. 
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Tabela 9.5 Funções de Green” 


Laplace Helmholtz Helmholtz modificada 
v? V? +k? vV? — k? 


) 1 
Espaço unidimensional Nenhuma solução z exp(ik|xzı — x2) Tê exp(—k|zı — xs|) 
para (— 00,00) 
i 


1 
HP (k| pı- p2) = Kolklp 1- p 2l) 


1 
Espaço bidimensional 5 In | p1— pal 
T 


4 27 
no . 1 1 exp(iklr, — r2 exp(—klry — rə 
Espaço tridimensional . DUR ) PEK D 
47 jra = rol A4r|ri = rol Ar|ri = ra | 
º Essas são as funções de Green que satisfazem a condição de fronteira G(r1,r2) = 0, quando rı — oo para os 


operadores de Laplace e Helmholtz modificados. Para o operador de Helmholtz, G(r1, r2) corresponde a uma onda de 


saída. HS” é a função de Hankel da Seção 11.4. Ko é a função modificada de Bessel da Seção 11.5. 


Expansão de Coordenadas Polares Esféricas? 
Como determinação alternativa da função de Green do operador de Laplace, vamos admitir uma expansão 
harmônica esférica da forma 


oo l 
Grir) =X > g(r r2)Yi (01, e) (02, 92), (9.181) 


l=0 m=—1 


em que o índice | do somatório é o mesmo para os harmônicos esféricos, como uma conseqüência da simetria da 
função de Green. Agora, determinaremos as funções radiais gı(r1, r2). Pelos Exercícios 1.15.11 e 12.6.6, 


1 
ô(rı — r2) = z2 Ô(rı — ro)ó(cos 04 — cos 02) (p1 — Po) 
1 
oo l 
1 * 
= minor, 2 KO p1)Y (02,92). (9.182) 


l=0 m=-—l 


Substituindo as Equações (9.181) e (9.182) na equação diferencial da função de Green, Equação (9.171), e fazendo 
uso da ortogonalidade dos harmônicos esféricos, obtemos a equação radial 
d2 
riza [Malr ra)] — I(l + 1)g(r1, r2) = —ó(r — r2). (9.183) 
1 
Agora temos um problema unidimensional. As soluções? da equação homogênea correspondente são r} e rj da 
Se exigirmos que gı permaneça finita à medida que rı — 0 e desapareça quando rı — co, a técnica da Seção 10.5 
leva a 


j 
1 rT Tı < T2, 
gi(r, 72) = 57 E] 7 (9.184) 
Feja ri > T2, 
ri 
ou ; 
1 r 
gilrı, r2) TEE TT (9.185) 
Daí, nossa função de Green é 
l 1 r! 
Genra) =>) >. gpa na i (On oi) (02, 9a). (9.186) 
l=0 m=— > 


2 Esta seção é opcional aqui e pode ser adiada até o Capítulo 12. 
25Compare com a Tabela 9.2. 
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Uma vez que já temos G(r1, r2) em forma fechada, Equação (9.175), podemos escrever 


oo l 
1 1 1 rk 
dot À mma VD > > == St AL Y”*(0 ; 9.187 
4r |ry—ro] 1=0 m=—1 2141 if! 1 (O1, 1)" (02, 23) ( ) 


Uma utilização imediata para essa expansão harmônica esférica da função de Green é no desenvolvimento de 
uma expansão multipolar eletrostática. O potencial para uma distribuição arbitrária de carga é 


sl p(r2) 
ve ÅTE0 f |rı a 


(que é a Equação (9.148)). Substituindo a Equação (9.187), obtemos 


oo l 
e 1º Y™(01, 91) 
a ooa r 


l=0 m=— 


. Joeovi (82, porá dyosenda dba rá dra para rı > ro. 


Essa é a expansão multipolar. A importância relativa dos vários termos no somatório duplo depende da forma da 
fonte, p(r2). 


»y 


Figura 9.4: Coordenadas polares esféricas 


Teorema da Adição de Polinômio de Legendre” 
Pela expressão geradora para polinômios de Legendre, Equação (12.4a), 


Ed s 3 e pilean) (9.188) 
. = g . 
AT Ira = rol 4AT Es po (Cos), 


em que y é o ângulo incluído entre os vetores rı e r2, Figura 9.4. Igualando as Equações (9.187) e (9.188), temos 
o teorema da adição de polinômios de Legendre: 


l 
47 m Mx 
Pi(cos 7) = 5 2o Yi (On, e) N(Oa, p2). (9.189) 


É instrutivo comparar essa derivação com a trabalhosa derivação quântica da Seção 12.8, que leva à 
Equação (12.177). 


Esta seção é opcional aqui e pode ser adiada até o Capítulo 12. 
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Expansão de Coordenada Cilíndrica Circular” 


Por analogia com a expansão de coordenada polar esférica precedente, escrevemos 


1 


ô(rı — r2) = p d(p1 — P2)ô(P1 — Po)dlzi — 22) 
1 
se E S ias O Ras 9.190 
= pi (P1 “Pg dé DE ; (9.190) 


usando o Exercício 12.6.5, a Equação (1.193c) e o valor principal de Cauchy. Mas, por que um somatório para a 
dependência de y e uma integração para a dependência de z? O requisito de que a dependência azimutal seja de 
valor único quantiza m, daí o somatório. Nenhuma restrição como essa se aplica a k. 

Para evitar problemas com valores negativos de k, mais tarde escrevemos a Equação (9.190) como 


OO 


1 1 TESE 
ô(ri o? an i Po) z7 5 ele: e cos k(21 — 22) dk. (9.191) 


m=— oo 


Admitimos uma expansão similar da função de Green, 


OO 


1 ; ve 
Glrur)= 55 D, puen ie f cos k(z1 — 22) dk, (9.192) 


m=— oo 


com os coeficientes gm (p1, p2) dependentes de p a serem determinados. Substituindo na Equação (9.171), agora 
em coordenadas cilíndricas circulares, constatamos que, se g(p4, po) satisfizer 


>|? dgm 
dpı “ dp, 


2 m? 
— |kºpy + A Im = —8(P1 — po), (9.193) 


então a Equação (9.171) é satisfeita. 

O operador na Equação (9.193) é identificado como o operador modificado de Bessel (em forma auto-adjunta). 
Por conseguinte, as soluções da equação homogênea correspondente são uy = Im(kp), u2 = Kym(kp). Como no 
caso da coordenada polar esférica, impomos que G seja finita em p4 = O e que se anule, à medida que p; — 00. 
Então, a técnica da Seção 10.5 resulta em 


1 
Gm(pi, pa) = -F Im(kp<)Km (kps). (9.194) 


Essa expressão corresponde à Equação (9.155). A constante A vem do wronskiano (veja a Equação (9.120): 


A 
Im(kp)Km(kp) — Im(kp)Km(kp) = . (9.195) 
P(kp) 
Pelo Exercício 11.5.10, A = —1 e 
Im(P1; P2) = Im(kp<)Kmlkp>). (9.196) 
Por conseguinte, nossa função de Green em coordenada cilíndrica circular é 
1 1 
ANE S Ea 
1 — i im = 
Si 5 f In(ko )Km(kps Je TPI PM) cos k(z1 — z2) dk. 
(9.197) 


O Exercício 9.7.14 é um caso especial desse resultado. 


2” Esta seção é opcional aqui e pode ser adiada até o Capítulo 11. 
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Exemplo 9.7.1 EspaLHAMENTO EM MECÂNICA QUÂNTICA — SOLUÇÃO DE SÉRIE DE NEUMANN 
A Teoria quântica do espalhamento dá uma boa ilustração de técnicas de equação integral e uma aplicação de uma 
função de Green. Nosso quadro físico de espalhamento é o que apresentamos a seguir. Um feixe de partículas está 
em movimento ao longo do eixo z negativo em direção à origem. Uma pequena fração das partículas é espalhada 
pelo potencial V(r) como uma onda esférica de saída. Nossa função de onda y(r) deve satisfazer a equação de 
Schrödinger, independente do tempo. 


2 
-Ë vue) + Vime) = Eyl), (9.198) 
2m 
ou 
V2y(r) + k2p(r) = — EV]. k’ = aa (9.198b) 


Pelo quadro físico que acabamos de apresentar, procuramos uma solução que tenha uma forma assintótica 


f ikr 
ble) ~ eE + fa(O, p) 


(9.199) 


Aqui, e'ko'” é a onda plana incidente’, sendo que ko, o vetor de propagação, leva o índice inferior O para indicar 

que ele está na direção 0 = 0 (eixo 2). As grandezas ko e k são iguais (ignorando o recuo), e'*” /r é a onda esférica 

de saída com um fator de amplitude fj.(0,») dependente do ângulo e da energia.” O vetor k tem a direção da 

onda de saída espalhada. Em textos de Mecânica Quântica é demonstrado que a probabilidade de espalhamento 

diferencial, do /d£?, a seção de choque de espalhamento por unidade de ângulo sólido, é dada por | fx (0, |°. 
Identificando [—(2m/h2)V (r)W(r)| com f(r) da Equação (9.158), temos 


y(r) = -J ZTV (raJ(ra)G(r1 r2) dra (9.200) 


pela Equação (9.170). Essa expressão não tem a forma assintótica desejada da Equação (9.199), mas podemos 
adicionar e'ko-r1 à Equação (9.200), uma solução da equação homogênea, e colocar y(r) na forma desejada: 


w(r1) = etom — | P ECE T (9.201) 


Nossa função de Green é a função de Green do operador L =V2+k2 (Equação (9.198)), satisfazendo a condição de 
contorno de que ele descreva uma onda de saída. Então, pela Tabela 9.5, G(r4,r2) = exp(ik|rı—r2|)/(4r|rı—r2l) 


iko-r Im e'tlri—ra] 
(r1) = cito — Vee) ga (9.202) 


Essa equação integral, análoga à equação de onda original de Schrôdinger, é exata. Empregando a técnica de série 
de Neumann da Seção 16.3 (lembre-se de que a probabilidade de espalhamento é muito pequena), temos 


polri) = eloa, (9.203a) 


que é a interpretação física de ausência de espalhamento. 
Substituindo yo(r2) = e'koT2 na integral, obtemos o primeiro termo de correção, 


e'tlri—ra] 


3 2 E 
Wi(r1) = eor / vt ekor? Bro. (9.203b) 


r 
h2 2 4rir — rol 


Esta é a famosa aproximação de Born. Espera-se que ela seja muito precisa para potenciais fracos e energia 
incidente alta. Se desejarmos uma aproximação mais precisa, a série de Neumann pode ser continuada.*? = 


28 Por simplicidade, admitimos um feixe incidente contínuo. Em um tratamento mais sofisticado e mais realista, a Equação (9.199) seria uma 
componente de um pacote de ondas de Fourier. 

Se V (r) representar uma força central, fy será uma função de 0 apenas, independente de azimute. 

30Isso admite que a série de Neumann é convergente. Em algumas situações físicas ela não é convergente, e então é preciso utilizar outras 
técnicas. 
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Exemplo 9.7.2  ESPALHAMENTO EM MECÂNICA QUÂNTICA — FUNÇÃO DE GREEN 

Mais uma vez, consideramos a equação de onda de Schrödinger (Equação 198b)) para o problema do espalhamento. 
Desta vez usamos técnicas de transformada de Fourier e derivamos a forma desejada da função de Green por 
integração de contorno. Substituindo a forma assintótica desejada da solução (com k substituído por ko), 


eikor 


plr) ~ e? + fro (0, p) =— = eo? + &(r), (9.204) 


r 


na equação de onda de Schrödinger, Equação (9.198b), temos como resultado 


(V? + kê) D(r) = U(r)e™? + U(r)d(r). (9.205a) 
Aqui, 
h2 
znU ®© = VC), 


o potencial perturbador de espalhamento. Uma vez que a probabilidade de dispersão é muito menor do que 1, 
espera-se que o segundo termo do lado direito da Equação (9.205a) seja desprezível (em relação ao primeiro termo 
do lado direito) e, por isso, nós o descartamos. Note que estamos aproximando nossa equação diferencial com 


(V? + kê) D(r) = U(r)e'tor., (9.205b) 


Agora, passamos a resolver a Equação (9.205b), uma EDP não-homogênea. O operador diferencial V? gera um 
conjunto contínuo de autofunções 
Ver) = —Kaby(r), (9.206) 


em que 
tle) = (20) Peter, 


Essas autofunções de onda plana formam um conjunto contínuo mas ortonormal, no sentido de que 
3 
feio) Pr = Ska = k) 


(compare com Equação (15.21d)).^! Usamos essas autofunções para derivar uma função de Green. 
Expandimos a função desconhecida ® (r1) nessas autofunções, 


(rı) = / Ak: Vy, (r1) ka, (9.207) 


uma integral de Fourier com Ay,, os coeficientes desconhecidos. Substituindo a Equação (9.207) na 
Equação (9.205b) e usando a Equação (9.206), obtemos 


i: Ar(ko — K)bu(r) dk = U(r)e'to*. (9.208) 


Usando a técnica já conhecida de multiplicar por Yý, (r) e integrando sobre as coordenadas espaciais, temos 


JAR) Era [ad (1) Pr = Asa (k 88) 


= / Wo (r)U(r)e®™ d?r. (9.209) 
Resolvendo para Av, e substituindo na Equação (9.207), temos 
(r2) = IG = AN fi (r1)U (reto En Pia (r2) dê ko. (9.210) 
Daí, 
(rı) = fr (r1) (k? — k?) dki fi (r2)U (r2)e™? dêro, (9.211) 
31 d3r = da dy dz, um elemento de volume (tridimensional) em espaço de r. 
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substituindo kə por kı e rı por ro para ficar de acordo com a Equação (9.207). Invertendo a ordem de integração, 
temos 


(rı) = — J Gro (r1, r2)U (r2)e™? dêro, (9.212) 
em que Gk (£1, r2), nossa função de Green, é dada por 
E (r r 
Gk (r1, r2) = I Pia (ra) (1) ap (9.213) 
ki — kô 


análoga à Equação (10.90) da Seção 10.5 para autofunções discretas. A Equação (9.212) deve ser comparada com 
a solução de função de Green da equação de Poisson (9.157). 

Talvez valha a pena avaliar essa integral para acentuar mais uma vez o papel vital desempenhado pelas condições 
de fronteira. Usando as autofunções da Equação (9.206) e 


dk = k? dksen6 do dy, 
obtemos 


1 © pm pr etkp cos 0 9 
Gk (r1, r2) = ao |, | f pa ONR dk. (9.214) 


Aqui, kp cos O substituiu k - (rı — r2), sendo que p = rı — r2 indica o eixo polar em espaço k. Integrando sobre 
( por inspeção, apanhamos um 27. Então, a integração em 6 leva a 


1 o0 etke = eTikp 
Gr (£1, r2) = al EE k dk, (9.215) 


e, visto que o integrando é uma função par de k, podemos estabelecer 


1 (0,0) ik _ p`ik 
Gro(r1, r2) = / fin ad (9216) 


“SPpilo R-o? 
A última etapa é realizada antecipando a avaliação de G,.(r4,r>) como uma integral de contorno. Os símbolos « e 
o(o > 0) representam kp e kop, respectivamente. 

Se a integral da Equação (9.216) for interpretada como uma integral de Riemann, a integral não existe. Isso 
implica que £7! não existe e, em um sentido literal, ela não existe. L = V? + k? é singular, uma vez que 
existem soluções triviais 1) para as quais a equação homogênea Ly = 0. Evitamos esse problema introduzindo um 
parâmetro y, definindo um operador Ly 1, diferente e tomando o limite, à medida que y — 0. 

Subdividindo a integral em duas partes, de modo que cada parte possa ser escrita como uma integral de contorno 


adequada, temos 
1 ke dk 1 ke" dk 
G = à 9.217 
(riro) 87?pi £ k2 — 0? E 872 pi A Rê — 0? ( ) 


O contorno C4 é fechado por um semicírculo no semiplano superior, C2, por um semicírculo no semiplano 
inferior. Essas integrais foram avaliadas no Capítulo 7 usando semicírculos infinitesimais adequadamente 
escolhidos para circundar os pontos singulares k = +ø. Como procedimento alternativo, em primeiro lugar vamos 
deslocar os pontos singulares do eixo real substituindo o por o + iy e então, após avaliação, considerando o limite 
quando y — 0 (Figura 9.5). 

Para y positivo, o contorno C4 envolve o ponto singular k = o + iy, e a primeira integral contribui com 


1 


2ni- L ilo+iy) 
Ti: ze 
Pela segunda integral, também obtemos 
E poi 
271 - dd 
sendo a singularidade envolvida x = —(o + iy). Voltando à Equação (9.217) e deixando y — 0, temos 


G 1 . e'Folri—ra] 
= — =D 9.218 
(ri, r2) Trp 4r|rı — ro? ( ) 
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SK) 


Figura 9.5: Possíveis contornos de integração da função de Green 


em total concordância com o Exercício 9.7.16. Esse resultado depende de começar com y positivo. Se tivéssemos 
escolhido y negativo, nossa função de Green teria incluído e™*7, que corresponde a uma onda de entrada. A 
escolha de y positivo é determinada pelas condições de contorno que desejamos satisfazer. 

As Equações (9.212) e (9.218) reproduzem a onda espalhada na Equação (9.203b) e constitui uma solução exata 
da Equação (9.205b) aproximada. Os Exercícios 9.7.18 e 9.7.20 ampliam esses resultados. = 


Exercícios 
9.7.1 Verifique a Equação (9.168), 


focou — ulov) dra = foa —uVov) - dos. 


9.7.2 Mostre que os termos +k? no operador de Helmholtz e —k2 no operador modificado de Helmholtz 
não afetam o comportamento de G(r1,r>) na vizinhança imediata do ponto singular rı = rə. 
Especificamente, mostre que 


lim k°G(rı, r2) dT2 = 1. 


lra—r>|=>0 
9.7.3 Mostre que 
exp(iklry — rs) 
4rir = ro| 


satisfaz os dois critérios adequados e, por conseguinte, é uma função de Green para a equação de 
Helmholtz. 
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9.7.4 


9.7.6 


9.7.8 


(a) Ache a função de Green para a equação tridimensional de Helmholtz, Exercício 9.7.3, quando 
a onda é uma onda estacionária. 
(b) Como essa função de Green está relacionada com as funções esféricas de Bessel? 


A equação homogênea de Helmholtz 
V2p+AMp=0 
tem autovalores A e autofunções p;. Mostre que a função de Green correspondente que satisfaz 
V2G(ry, ro) + A G(ra, ro) = —ô(rı — r2) 


pode ser escrita como 


G(r1, r2) = 5 paa, 
i=1 io 


Uma expansão dessa forma é denominada expansão bilinear. Se a função de Green estiver 
disponível na forma fechada, isso nos dá um meio de gerar funções. 


Um potencial eletrostático (unidades mks) é 


( ) Z e er 
r)= . ; 
4 4reo r 


Reconstrua a distribuição de carga elétrica que produzirá esse potencial. Note que y(r) desaparece 
exponencialmente para r grande, o que demonstra que a carga líquida é zero. 


Resposta: p(r) = Zó(r) — —— 


Transforme a EDO ; (r) 
dylr 2 e” 
E — kylr) + Vo u(r)=0 


e as condições de contorno y(0) = y(oo) = 0 em uma equação integral de Fredholm da forma 


y(r) = af G(r, Nv dt. 


As quantidades Vo = A e k? são constantes. A EDO é derivada da equação de onda de Schrödinger 
com um potencial mesônico: 


1 

ge "senhkr, 0O<r<t, 
Gens 

po" senhkt, t<r<oo. 


Um anel condutor de raio a (Exemplo 12.3.3) pode ser descrito por 


plr) = —L6(r — ajó(cos 6). 


2ra? 


Usando a função de Green conhecida para esse sistema, a Equação (9.187), ache o potencial 
eletrostático. 
Sugestão: O Exercício 12.6.3 será útil. 


Mudando uma constante de separação de k? para —k? e colocando a descontinuidade da derivada 
de primeira ordem na dependência z, mostre que 


1 1 


4rir — rə| AT a 


D J (PPT, (kpy) Jm(kpo)e” "l dk. 


Sugestão: O (pı — pz) requerido pode ser obtido do Exercício 15.1.2. 
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9.7.10 


9.7.11 


9.7.12 


9.7.13 


9.7.14 


9.7.15 


Derive a expansão 
: oo jilkrı)h™ (kra) Tı < T2 
expļik|rı — rə|] k y ' ? 


= 74 
4 => 
mira — rol =0 | jilkra) h (kri), ri >r 


l 
x XO YP (01, py)” (02, p2). 


m=-—l 


Sugestão: O lado esquerdo é uma função Green conhecida. Admita uma expansão 
harmônica esférica e trabalhe na dependência radial remanescente. A relação de fechamento do 
harmônico esférico, Exercício 12.6.6, abrange a dependência angular. 


Mostre que a função de Green para o operador modificado de Helmholtz 


exp(—kļ|rı — r2ļ) 


4r|rı — r2] 


tem a expansão coordenada polar esférica 


oo l 
exp(—k|rı — r ; m ma 
CRB!) =k X ilkre)kilkr>) XO YP (01, pr)Y* (02, p2). 
1=0 m=—l 


4rIr — r2 


Nota: As funções esféricas modificadas de Bessel i(kr) e kı(kr) são definidas no Exercício 
11.7.15. 


Pela função esférica de Green do Exercício 9.7.10, derive a expansão de onda plana 


OO 


eter = Yo il(21 + 1)ji(kr)P;(cos 7), 
1=0 


em que é o ângulo incluído entre k e r. Essa é a equação de Rayleigh do Exercício 12.4.7. 
Sugestão: Considere r >> rı, de modo que 
k. rı 

po 


|r1 — rə| > r2 — r20 `: rı = r2 — 


Deixe que r2 — oo e cancele um fator de etkr2 /ro. 


Pelos resultados dos Exercícios 9.7.10 e 9.7.12, mostre que 
e = Xoia + Dj). 


(a) Pela expansão em coordenada cilíndrica circular da função de Green de Laplace 
(Equação (9.197)), mostre que 


1 
(p2 + 22)1/2 


2 oO 
= / Ko(kp) cos kz dk. 
T Jo 


Esse mesmo resultado é obtido diretamente no Exercício 15.3.11. 
(b) Como caso especial da parte (a), mostre que 


T 


f Ko(k) dk = 5 


Observando que 
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9.7.16 


9.7.17 


9.7.18 


9.7.19 


9.7.20 


é uma autofunção de 
(V? + R)belr)=0, 


(Equação (9.206)), mostre que a função de Green de £L = V? pode ser expandida como 


1 1 lj PRE 
= e na 
Ami — ro) (27) k? 


Usando transformadas de Fourier, mostre que a função de Green que satisfaz a equação não- 
homogênea de Helmholtz 


(v? + kê)G(r1,r2) = —ô(rı = r2) 


1 eike(ri—ra) ” 
G(ry,ro) = aa k2 — k2 d k, 


O 


de acordo com a Equação (9.213). 


A equação básica da teoria da difração escalar de Kirchhoff é 


yr) = =), 


em que y satisfaz a equação homogênea de Helmholtz e r = |r — rs |. Derive essa equação. Admita 
que r; é interior à superfície fechada Ss. 
Sugestão: Use o teorema de Green. 


[E vee) Š vtrav( E) gde: 


2 


A aproximação de Born para a onda espalhada é dada pelas Equações (9.203b) e (9.211). Pela forma 
assintótica, pela Equação (9.199), 


ikr 


e 2m etklr=ra] 
8 PSS V iko-ra 3 E 
fel 19) r h2 / (2) rr ral d T2 


Para um potencial de dispersão V (r2) que é independente de ângulos e para r >> r2, mostre que 


swa ST a E 
0 Iko — k| 

Aqui, ko está na direção 0 = 0 (eixo z original), ao passo que k está na direção (0, y). As grandezas 

são iguais: |ko| = |k|; m é a massa reduzida. 

Sugestão: Você tem o Exercício 9.7.12 para simplificar a exponencial e o Exercício 15.3.20 para 

modificar a transformada exponencial de Fourier tridimensional em transformada de seno de Fourier 

unidimensional. 


Calcule a amplitude de dispersão fy(0,() para um potencial mesônico V (r) = Vo(e ar). 
Sugestão: Esse potencial particular permite que a integral de Born, Exercício 9.7.18, seja avaliada 
como uma transformada de Laplace. 
2mVo 1 

ha a? + (ko — k)? 
O potencial mesônico V(r) = Voọ(e7®" /ar) pode ser usado para descrever o espalhamento de 
Coulomb de duas cargas qı e q2. Fazemos a > 0 e Vo — 0, mas tomamos a razão Vo/a como 
q192/47€0- (Para unidades gaussianas, omita o 4720.) Mostre que a seção de choque diferencial de 
espalhamento do /dQ = | fx (0, p)|? é dada por 


do (gy 1 pn? 
41€e0 


Resposta: fk(0, p) = 


E = 
16E2sen*(0/2)' 2m 2m 


dQ 


Acontece (coincidentemente) que essa aproximação de Born está em exata concordância com os 
cálculos exatos da Mecânica Quântica e também com o clássico cálculo de Rutherford. 
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9.8 EDP de Fluxo de Calor ou de Difusão 


Agora voltamos para uma EDP especial para desenvolver métodos razoavelmente gerais para adaptar uma solução 
especial de uma EDP a condições de contorno, introduzindo parâmetros que também se aplicam a outras EDPs 
de segunda ordem com coeficientes constantes. Até certo ponto, eles são complementares ao método básico de 
separação já estudado para achar soluções de um modo sistemático. 

Selecionamos a EDP completa de difusão dependente de tempo como um meio isotrópico. Admitimos que a 
isotropia não é grande coisa em matéria de restrição porque, no caso de termos diferentes taxas (constantes) de 
difusão em diferentes direções (por exemplo, na madeira), nossa EDP de fluxo de calor toma a forma 
o 20 
dE a Ca OC de 
se colocarmos os eixos coordenados ao longo das principais direções de anisotropia. Agora, simplesmente 
elevamos as coordenadas usando as substituições x a£, y bn, z cf para recuperar a forma isotrópica 
original da Equação (9.219), 


(9.219) 


ð gp A 926 E 925 
dt aÈ O ə? 
para a função de distribuição de temperatura P(E, n, C, t) = Y(z, y, z, t). 


Por simplicidade, em primeiro lugar resolvemos a EDP dependente de tempo para um meio unidimensional 
homogêneo, um longo bastão de metal na direção x, digamos, 


(9.220) 


o 9? 
er L es (9.221) 
ot dx 
em que a constante mede a difusividade ou condutividade de calor, y, do meio. Tentamos resolver essa EDP 
linear com coeficientes constantes com o relevante Ansatz do produto exponencial ) = e” . eft, que, 


quando substituído na Equação (9.221), resolve a EDP com a restrição 3 = a?a? para os parâmetros. Buscamos 


soluções que se degradam exponencialmente para tempos grandes, isto é, soluções com valores 8 negativos e, por 
conseguinte, estabelecemos a = iw, q = —w? para w real, e temos 


. 2,2 N a) 
p(x, t) = Pe Tt — (coswz + isenwr)e™™ t+, 
Formando combinações lineares reais, obtemos a solução 
—w2a2t 
y(x, t) = (Acoswa + Bsenwa:)e : 


para qualquer escolha de A, B, w, que são introduzidos para satisfazer condições de contorno. Fazendo o somatório 
sobre múltiplos nw da frequência básica para condições periódicas de contorno ou integrando sobre o parâmetro 
w para condições gerais de contorno (não-periódicas), encontramos uma solução, 


p(z, t) = fo coswa + B(w)senwz'] E dw, (9.222) 


que é suficientemente geral para ser adaptada a condições de contorno em, digamos, t = 0. Quando a condição 

de contorno dá uma temperatura não-zero pgo, como acontece para nosso bastão, então o método do somatório se 

aplica (expansão de Fourier da condição de contorno). Se o espaço for irrestrito (como no caso de um bastão de 

extensão infinita), a integral de Fourier se aplica. 

e Esse somatório ou integração sobre parâmetros é um dos métodos padrões para generalizar soluções de EDPs 
específicas de modo a adaptá-las às condições de contorno. 


Exemplo 9.8.1 UMA CONDIÇÃO DE CONTORNO ESPECÍFICA 
Vamos resolver explicitamente um caso unidimensional em que a temperatura no tempo t = 0 é Yo(x) = 1 = 
constante no intervalo entre x = +lex = —1 e zero para x > 1 ex < 1. Nas extremidade, x = +1, a temperatura 
é sempre mantida em zero. 

Para um intervalo finito escolhemos as soluções espaciais cos(lrmx/2) da Equação (9.221) para l inteiro, porque 
elas desaparecem em x = +1. Assim, em t = 0, nossa solução é uma série de Fourier, 


oO 


yp(x,0) = antas Cel; —I<ar<l 
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com coeficientes (veja a Seção 14.1.) 


4 irn 4a 
qo (2m + 1)m' Beja 


a = 0, | = 2m. 


Incluindo sua dependência do tempo, a solução completa é dada pela série 


4 (Mm 
War t)=—5. CY cos| (2m + 1) FE Je Mensaroça, (9.223) 
T 


que converge absolutamente para t > 0, mas apenas condicionalmente em t = 0, como resultado da descon- 
tinuidade em x = +1. 

Sem a restrição à temperatura zero nas extremidades do intervalo finito dado, a série de Fourier é substituída 
por uma integral de Fourier. Nesse caso, a solução geral é dada pela Equação (9.222). Em t = 0, a distribuição de 
temperatura dada o = 1 dá os coeficientes como (veja a Seção 15.3) 


if! 1 senwz |" 2senw 
A(w) = — cos wa dx = — = ; B(w)=0 
TJ T w liso TW 
Por conseguinte, 
2 [®© senw But 
p(z, t) = — — cos(wr)e dw. (9.224) 
T Jo wW 
E 
Em três dimensões o correspondente Ansatz exponencial y = e'kr/2+8t leva a uma solução com a relação 
8 = —k? = —k? para seu parâmetro, e a forma tridimensional da Equação (9.221) se torna 
ə? o? 92 
Y e + Y + k?y =0, (9.225) 


dx? Ro dy. Oz 


que é a equação de Helmholtz, a qual pode ser resolvida pelo método de separação exatamente como 
antes a equação de Laplace em coordenadas cartesianas, cilíndricas ou esféricas, sob condições de contorno 
adequadamente generalizadas. 

Em coordenadas cartesianas, com o Ansatz do produto da Equação (9.35), as EDOs separadas de x e y da 
Equação (9.221) são as mesmas que as Equações (9.38) e (9.41), enquanto a EDO de z, Equação (9.42), generaliza 
para 


1 Z 
P k? +P Hm =n? >O, (9.226) 


em que introduzimos uma outra constante de separação n?, restringida por 
k= tmr-nRn, (9.227) 


para produzir um conjunto simétrico de equações. Agora, nossa solução da equação de Helmholtz, Equação (9.225) 
é rotulada de acordo com a escolha de todas as três constantes de separação l, m,n sujeita à restrição da 
Equação (9.227). Como antes, a EDO em z, Equação (9.226), dá como resultado soluções ~ e7”7 que 
decaem exponencialmente. A condição de contorno em z = () fixa os coeficientes de expansão am, como na 
Equação (9.44). 
Agora, em coordenadas cilíndricas, usamos a constante de separação l? para a EDO em z, tendo em mente uma 
solução que decai exponencialmente, 
2 
e PZ >0, (9.228) 


z2 
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portanto, Z ~ e-!Z, porque a temperatura cai a zero em z grande. Se estabelecermos k? + l? = n2, as 


Equações (9.53) e (9.54) continuam as mesmas, portanto acabamos com a mesma expansão de Fourier-Bessel, 
Equação (9.56), como antes. 
Em coordenadas esféricas com condições de contorno radiais, o método de separação leva às mesmas EDOs 
angulares das Equações (9.61) e (9.64), e a EDO radial agora se torna 
1d dR R 
dO qn Dj QE, (9.229) 
r2 dr dr r2 
isto é, da Equação (9.65), cujas soluções são as funções esféricas de Bessel da Seção 11.7. Elas estão relacionadas 
na Tabela 9.2. 


A restrição de que k? seja uma constante é desnecessariamente severa. O processo de separação ainda funcionará 
com EDP de Helmholtz para k? tão geral quanto 


1 


k? = f(r) + =39(0) + hlp) +k”. (9.230) 


r2sen26 
No átomo de hidrogênio temos k? = f(r) na equação de onda de Schrödinger, e isso leva a uma solução de forma 
fechada que envolve polinômios de Laguerre. 


Soluções Alternativas 

Em uma nova abordagem da EDP de fluxo de calor sugerida por experimentos, voltamos agora à EDP 
unidimensional, Equação (9.221), em busca de soluções de uma nova forma funcional y(x, t) = u(x/w't), que é 
sugerida pelo Exemplo 15.1.1. Substituindo u(£), € = x //t, na Equação (9.221), usando 


ð 1 8? nm ð 
Y = 4 ; Y = o j Y = £ u! (9.231) 
ðr t da? t ot 2/3 
com a notação u’ (£) = q a EDP é reduzida à EDO 
202u" (E) + Eu! (E) = 0. (9.232) 
Escrevendo essa EDO como 
u” E £ 
w 32? 
podemos integrá-la uma vez para obter ln u’ = — & +ln C1, com uma constante de integração C1. Exponenciando 


e integrando novamente, encontramos a solução 


£ 2 
u(é) = c f eTa? dE + C9, (9.233) 
0 


que envolve duas constantes de integração C;. A normalização dessa solução no tempo t = 0 e temperatura +1 
para x > 0e —1 para x < 0, nossas condições de contorno, fixa as constantes C;; portanto, 


1 Ae 2 [mos £ 
= ——— e 42 d = —— e? dv = O , 
=) = e (204) 


em que P denota a função erro de Gauss (veja o Exercício 5.10.4). Para uma derivação usando a transformada 
de Fourier, veja o Exemplo 15.1.1. Precisamos generalizar essa solução específica para adaptá-la às condições de 
contorno. 

Com essa finalidade, agora geramos novas soluções da EDP com coeficientes constantes diferenciando uma 
solução especial, Equação (9.234). Em outras palavras, se Y(x, t) resolve a EDP na Equação (9.221), ae e n 
também resolvem, porque essas derivadas e as diferenciações da EDP comutam; isto é, a ordem na qual elas são 
efetuadas não importa. Observe com cuidado que esse método deixa de funcionar se qualquer coeficiente da EDP 
depender explicitamente de t ou x. Todavia, EDPs com coeficientes constantes são presença dominante na Física. 
Alguns exemplos são as equações de movimento de Newton (EDOs) na Mecânica Clássica, as equações de onda 
da Eletrodinâmica e as equações de Poisson e Laplace da Eletrostática e da Gravidade. Mesmo as equações de 


(9.234) 
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campo não-lineares da Relatividade Geral de Einstein assumem essa forma especial em coordenadas geodésicas 
locais. 
Portanto, diferenciando a Equação (9.234) em relação a x, encontramos a solução mais simples, mais básica, 


plz, t) = 


ET dam, (9.235) 


e, repetindo o processo, uma outra solução básica, 


x z2 
polz, t) = ——— =e 4%, (9.236) 
Í VT 
Mais uma vez, essas soluções têm de ser generalizadas para adaptá-las a condições de contorno. E há ainda um 
outro método de gerar novas soluções de uma EDP com coeficientes constantes: podemos transpor uma dada 
solução, por exemplo, (x,t) — Yı(x — a, t), e então integrá-la sobre o parâmetro de translação a. Por 
conseguinte, 


_ (z-a)? 


1 OO 
p(z, t) = TA C(aje” 44% da (9.237) 


é novamente uma solução que reescrevemos usando a substituição 


L— a 
E= A a = x — 2a vt, da = —2a dé vt. (9.238) 


Assim, constatamos que 
1 F 2 
p(x, t) = =| C(x — 20EV't)e 8 dé (9.239) 
VT Jo 


é uma solução de nossa EDP. Sob essa forma, reconhecemos a significância da função peso C(x) do método 
de translação porque, em t = 0, y(x,0) = C(x) = polr) é determinada pela condição de contorno, e 


o0 —¿? . r x 
Jf _e € dé = y/T. Por conseguinte, também podemos escrever a solução como 
—00 


Y(z,t) = = J: j polz — 2a£vt Je É dE, (9.240) 


demonstrando explicitamente o papel da condição de contorno. Pela Equação (9.240), vemos que a distribuição 
inicial de temperatura, Yo (x), se expande com o tempo e é atenuada pela função peso de Gauss. 


Exemplo 9.8.2 NOVAMENTE A CONDIÇÃO DE CONTORNO ESPECIAL 


Vamos expressar a solução do Exemplo 9.8.1 em termos da solução de função erro da Equação (9.234). A condição 
de contorno emt = 0 é g(x) = 1 para —1 < x < 1 ezero para |x| > 1. Pela Equação (9.240), achamos os 
limites sobre a variável de integração £ estabelecendo x — 2a£/t = +1, o que dá como resultado as extremidades 
de integração £ = (+1 + x) /2a/t. Por conseguinte, nossa solução se torna 


2+1 
1 2a vã 2 
RS e é é dé 
2a vt 


Usando a função erro definida na Equação (9.234), também podemos escrever essa solução da seguinte maneira: 


ylz, t) = ! ee) e(z) (9.241) 


Comparando essa forma de nossa solução com a do Exemplo 9.8.1, vemos que podemos expressar a 
Equação (9.241) como a integral de Fourier do Exemplo 9.8.1, uma identidade que dá a integral de Fourier integral, 
Equação (9.224), em forma fechada da função erro tabulada. 
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E 

Por fim, consideramos o caso do fluxo de calor para um meio esfericamente simétrico estendido, com centro na 

origem, o que prescreve coordenadas polares r, 0, p. Esperamos uma solução da forma y(r, t) = u(r, t). Usando 
a Equação (2.48), encontramos a EDP 


ðu (Pu 2ðu 
T’ (5 +$ w), (9.242) 


que transformamos na EDP de fluxo de calor unidimensional pela substituição 


v(r,t) ðu 1dv v ðu lv 
r?’ ðr rðr r? ðt rot’ 
Ou 10 2 ðv 2w 


= i .24 
ðr? rr? qy20r i: r3 pr 


Essa expressão resulta na EDP 


du 20 
o O gr 
Exemplo 9.8.3 FLUXO DE CALOR ESFERICAMENTE SIMÉTRICO 
Vamos aplicar a EDP de fluxo de calor unidimensional com a solução da Equação (9.234) a um fluxo de calor 
esfericamente simétrico sob condições de fronteira razoavelmente comuns, em que x é liberado pela variável 
radial. Inicialmente, temos temperatura zero em todos os lugares. Então, no tempo t = 0, uma quantidade finita de 
energia térmica Q é liberada na origem, espalhando-se uniformemente em todas as direções. Qual é a distribuição 
de temperatura espacial e temporal? 
Inspecionando nossa solução especial na Equação (9.236), vemos que, para t — 0, a temperatura 
a (9.245) 
r ve 
vai a zero para todo r Æ 0, portanto a temperatura inicial zero está garantida. À medida que t — oo, a temperatura 
v/r — 0 para todo r, incluindo a origem, o que está implícito em nossas condições de contorno. A constante C' 
pode ser determinada por conservação de energia, o que dá a restrição 


(9.244) 


4ropC [O r? 
Q= ap [ “d?r = TE À r2e” ia% dr = 8V T? opa C, (9.246) 
0 


em que p é a densidade constante do meio e o é seu calor específico. Aqui, elevamos novamente a variável de 
integração e integramos por partes para obter 


(0,6) 72 D0 
J e tzr? dr = Caviy f eË E de, 
0 0 
D0 [9,0] 1 D0 
/ e- ede = Eet) + 5), e dé = VT 
0 2 0 2 Jo 


a 
A temperatura, como dada pela Equação (9.245) a qualquer instante, que está em t, é uma distribuição gaussiana 
que se achata à medida que o tempo aumenta, porque sua largura é proporcional a /t. Por ser uma função do 
tempo, a temperatura é proporcional a t3/2e-7/t, com T = r2/4a2, que se eleva de zero até um máximo e então 
volta a cair para zero para tempos grandes. Para achar o máximo, estabelecemos 


T 
£ ega = 4 5/2e-T/t (5 NE 5) =0, (9.247) 


2 


pela qual encontramos t = 2T/3. 
E 
No caso de simetria cilíndrica (no plano z = 0 em coordenadas polares planas p = 4/12 + y?, p) procuramos 


uma temperatura 1) = u(p, t) que então satisfaça a EDO (usando a Equação (2.35) na equação de difusão) 


ðu (u 10u 
= 24 
o" (3 y 255) fato 
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que é a planar análoga da Equação (9.244). Essa EDO também tem soluções com a dependência funcional 
p/N't = r. Por substituição, 


p ðu pv” ðu v Pu v 
u (£); ðt 243/2? ðp VE op? t , ( ) 
na Equação (9.248) com a notação v’ = w, encontramos a EDO 
2,4 a? T d 
afv +| — +- lv =0. (9.250) 
r 2 


Essa é uma EDO de primeira ordem para v’, que podemos integrar quando separamos as variáveis v e r como 


v" 1 r 
= : 251 
v’ C iz =) A 
Isso resulta em 
C r2 t p? 
v(r) = mi =: SER 402%, (9.252) 


Essa solução especial para simetria cilíndrica pode ser generalizada e adaptada de modo semelhante a condições 
de contorno, como o caso esférico. Por fim, a dependência z pode ser fatorada porque z separa da variável radial 
polar plana p. 


Resumindo, EDPs podem ser resolvidas com condições iniciais, exatamente como EDOs ou com condições 
de contorno que prescrevem o valor da solução ou sua derivada em superfícies, curvas ou pontos de contorno. 
Quando a solução é prescrita sobre o contorno, a EDP é denominada problema de Dirichlet; se a derivada normal 
da solução é prescrita sobre o contorno, a EDP é denominada problema de Neumann. 

Quando a temperatura inicial é prescrita para uma equação de calor unidimensional ou tridimensional (com 
simetria esférica ou cilíndrica), ela se torna uma função peso da solução, em termos de uma integral sobre 
a solução gaussiana genérica. A equação de calor tridimensional, com condições de fronteira esféricas ou 
cilíndricas, é resolvida por separação das variáveis, o que leva a autofunções em cada variável separada e a 
autovalores como constantes de separação. Para intervalos de contorno finitos em cada coordenada espacial, a 
soma sobre constantes de separação leva a uma solução de série de Fourier, enquanto condições de contorno 
infinitas levam a uma solução de integral de Fourier. O método de separação de variáveis tenta resolver uma EDP 
escrevendo a solução como um produto de funções de uma variável cada. As condições gerais para que o método 
de separação funcione são fornecidas pelas propriedades de simetria da EDP, à qual se aplica a teoria de grupo 
contínuo. 
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Teoria de Sturm-Liouville — Funções 
Ortogonais 


No capítulo anterior desenvolvemos duas soluções linearmente independentes da equação diferencial linear 
homogênea de segunda ordem e provamos que não existia nenhuma terceira solução linearmente independente. 
Neste capítulo a ênfase passa da solução da equação diferencial para o desenvolvimento e entendimento 
de propriedades gerais das soluções. Há uma estreita analogia entre os conceitos deste capítulo e os da 
álgebra linear no Capítulo 3. Aqui, as funções desempenham o papel que os vetores desempenhavam lá, e os 
operadores lineares desempenham o papel que as matrizes desempenhavam no Capítulo 3. A diagonalização de 
uma matriz real simétrica no Capítulo 3 corresponde aqui à solução de uma EDO definida por um operador auto- 
adjunto £ em termos de suas autofunções, que são as análogas “contínuas” dos autovetores no Capítulo 3. As 
hamiltonianas da Mecânica Quântica e suas autofunções de energia são exemplos da analogia correspondente 
entre matrizes hermitianas e operadores hermitianos. 

Na Seção 10.1 são apresentados os conceitos de operador auto-adjunto, autofunção e autovalor e de operador 
hermitiano. O conceito de operador auto-adjunto, dado em primeiro lugar em termos de equações diferenciais, 
é então definido de acordo com a utilização em Mecânica Quântica, em que autofunções assumem valores 
complexos. As propriedades vitais de realidade de autovalores e ortogonalidade de autofunções são derivadas na 
Seção 10.2. Na Seção 10.3 discutimos o procedimento de Gram-Schmidt para construir sistematicamente conjuntos 
de funções ortogonais. Por fim, a propriedade geral de completude de um conjunto de autofunções é explorada na 
Seção 10.4, e na Seção 10.5 retomamos as funções de 


10.1 EDO Auto-Adjuntas 


No Capítulo 9 estudamos, classificamos e resolvemos EDO lineares de segunda ordem correspondentes a 
operadores diferenciais lineares de segunda ordem da forma geral 


Lula) = pola) des ue) + pila) Sula) + pola)ula). (10.1) 


Os coeficientes po(x), pı(x) e po(x:) são funções reais de z e, sobre a região de interesse, a < x < b, as primeiras 
2 — à derivadas de p;(x) são contínuas. Referindo-nos à Equação (9.118), vemos que P(x) = pi(x)/po(x) e 
Q(x) = pa(x)/po(x). Por conseguinte, po(x) não deve desaparecer para a < x < b. Agora, os zeros de po(x) são 
pontos singulares (Seção 9.4) e a afirmação precedente significa que nosso intervalo [a, b] deve ser tal que não haja 
nele nenhum ponto singular. Pode haver, e muitas vezes há, pontos singulares nas fronteiras. 

Para um operador linear £, o análogo de uma forma quadrática para uma matriz no Capítulo 3 é a integral 


b 


(ulL|u) = (ullu) = / u(x)Lu(x) da 


a 


b 
= | u{pou” + piu’ + pou} de, (10.2) 


em que as linhas da função real u(x) denotam derivadas, como sempre, e, por simplicidade, admitimos que u(x) é 
real. Se passarmos as derivadas para o primeiro fator, u, na Equação (10.2) integrando por partes uma vez ou duas 
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vezes, temos como resultado a expressão equivalente 


(ul£lu) = [ule)(p — poJu(a))? 


o æ d 
eS A Ealo $ pru] + pzu bude. (10.3) 


Se exigirmos que as integrais nas Equações (10.2) e (10.3) sejam idênticas para todas as funções u (diferenciáveis 
duas vezes), então os integrandos têm de ser iguais. Assim, a comparação resulta em 


u(po — piu + 2u(po — piu” =0, 
ou 
po(x) = pi(a), (10.4) 
e, como bônus, os termos nas fronteiras x = a e x = b na Equação (10.3) também desaparecem. 


Por causa da analogia com a matriz transposta no Capítulo 3, é conveniente definir o operador linear na 
Equação 10.3), 


= d? d 
Lu = qa Pou] = qP] + pou 
du du 
= pozzz + (2Po =P) T (Po — Pi + p2)u, (10.5) 


como o operador adjunto! £. Definimos o operador adjunto £ e mostramos que, se a Equação 10.4) for 
satisfeita, (Lulu) = (ulLu). Seguindo o mesmo procedimento, podemos mostrar de um modo mais geral que 
(v|£u) = (Lvlu). Quando essa condição é satisfeita, 


Lu = Lu = - o(a) mn + g(a)u(a), (10.6) 


diz-se que o operador £ é auto-adjunto. Aqui, para o caso auto-adjunto, po(x), é substituído por p(x) e pa(x) 
por q(x), para evitar índices desnecessários. A forma da Equação (10.6) permite efetuar duas integrações por 
partes na Equação (10.3) e Equação (10.22) e seguintes sem termos integrados.? Note que um dado operador não 
é inerentemente auto-adjunto; essa sua condição depende das propriedades do espaço funcional no qual ele age e 
das condições de fronteira. 

Em um levantamento das EDO introduzidas na Seção 9.3, a equação de Legendre e a equação do oscilador linear 
são auto-adjuntas, mas outras, tais como as equações de Laguerre e Hermite, não são. Contudo, a teoria de equações 
diferenciais lineares de segunda ordem auto-adjuntas é perfeitamente geral porque sempre podemos transformar 
o operador não-auto-adjunto na forma auto-adjunta requerida. Considere a Equação (10.1) com p) £ pı. Se 


multiplicarmos £ por? 
1 ? p(t 
to | / pı( Lal, 
pola) po(t) 


= el) oaa aaa 
ga o f pı (t) at u, (10.7) 


po(x) po(t) 


1O operador adjunto guarda uma relação de certo modo forçada com a matriz adjunta. Uma justificativa melhor para a nomenclatura é 
encontrada em uma comparação do operador auto-adjunto (mais condições de fronteira adequadas) com a matriz adjunta. As propriedades 
significativas são desenvolvidas na Seção 10.2. 

2A maior importância da forma auto-adjunta (mais condições de fronteira) ficará evidente na Seção 10.2. Além disso, serão exigidas formas 
auto-adjuntas para desenvolver funções de Green na Seção 10.5. 

3 Se multiplicarmos £ por f(x) /po (x) e então impusermos que 


fa) = 


obtemos 


fpı 
RN: 
Po 
de modo que o novo operador será auto-adjunto, obtemos 


roseo Ba] 
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que é claramente auto-adjunta (veja a Equação (10.6)). Note po(x) no denominador. É por isso que impomos que 
polz) £0,a < x < b. No desenvolvimento a seguir, admitimos que £ foi colocado na forma auto-adjunta. 


Autofunções, Autovalores 
A equação de onda de Schrödinger 


Hy(x) = Ela) 


é o exemplo mais importante de uma equação de autovalor em Física; aqui, o operador diferencial £ é definido 
pela hamiltoniana H e não pode mais ser real, e o autovalor se torna a energia total E do sistema. A autofunção 
p(x) pode ser complexa e costuma ser denominada função de onda. Uma formulação variacional dessa 
equação de Schrödinger aparece na Seção 17.7. Com base em propriedades esféricas, cilíndricas ou algumas 
outras propriedades de simetria, uma EDP tridimensional ou quadridimensional ou equação de autovalor, tal 
como a equação de Schrödinger, pode ser separada em equações de autovalor de uma única variável cada. As 
Equações (9.41), (9.42), (9.50) e (9.53) são exemplos. Contudo, às vezes uma equação de autovalor toma a forma 
mais geral auto-adjunta 


Lu(x) + Aw(x)u(x) = 0, (10.8) 
em que a constante À é o autovalor! e w(x) é um peso conhecido ou função densidade; w(x) > 0 exceto 
possivelmente em pontos isolados nos quais w(x) = 0. (Na Seção 10.1), w(x) = 1.) Para uma dada escolha 


do parâmetro À, uma função, u(x), que satisfaz a Equação (10.8) e as condições de fronteira impostas, é 
denominada autofunção correspondente a À. A constante À então é denominada autovalor pelos matemáticos. 
Não há nenhuma garantia de que existirá uma autofunção u(x) para uma escolha arbitrária do parâmetro À. Na 
verdade, o requisito de que haja uma autofunção costuma restringir os valores aceitáveis de À a um conjunto 
discreto. Exemplos disso para as equações de Legendre, Hermite e Chebyshev aparecem nos exercício da Seção 
9.5. Aqui, adotamos a abordagem matemática do processo de quantização da Mecânica Quântica. 

O produto interno de duas funções, (v|u) = f? v*(x)w(x)u(x) dx, depende da função peso e generaliza nossa 
definição anterior, em que w(x) = 1. A função peso também modifica a definição de ortogonalidade de duas 
autofunções: elas são ortogonais se seu produto interno (ux |ux) = 0. A função peso extra w(x) às vezes aparece 
como uma função de onda assintótica Y. que é um fator comum em todas as soluções de uma EDP, tal como a 
equação de Schrödinger, por exemplo, quando o potencial V(x) — 0, à medida que x —> œ em H = T + V. 
Podemos achar %„„ quando estabelecemos V = 0 na equação de Schrödinger. Uma outra fonte para w(x) pode 
ser uma barreira de momento angular não-zero I(l + 1)/x? em uma EDP ou EDO separada, Equação (9.65), que 
tem uma singularidade regular e domina em x — 0. Nesse caso, a equação indicial, tal como a Equação (9.87) ou 
(9.103), mostra que a função de onda tem z’ como um fator global. Visto que a função de onda entra duas vezes 
em elementos de matriz e relações de ortogonalidade, as funções peso da Tabela 10.1 vêm desses fatores comuns 
em ambas as funções de onda radiais. É assim que surge o exp(—«) para polinômios de Laguerre e x* exp(— z) 
para polinômios associados de Laguerre na Tabela 10.1. 


Tabela 10.1 
Equação pla) do) X wla) 
Legendre? 1-4? 0 (L+1) 1 
Legendre deslocada” a(1— zx) 0 lL+1) 1 
Legendre associada? 1- q? -m?/(1 — z?) +1) 1 
Chebyshev I (1 — z?)!/2 0 n? (1 = z?) 
Chebyshev deslocada I le(1 — 2))!/2 0 n? [e(l — r)? 
Chebyshev II (1 = z?)3/2 0 n(n +2) (1 = z?) 12 
Ultralsférica (Gegenbauer) (1 — z?)et1/2 0 n(n +2a) (1-02)0-1/2 
Bessel, 0< z <a z —n?/x a? z 
Laguerre, O < £x < œ xe” (0) a e” 
Laguerre associada” e ca 0 a-—k rte? 
Hermite, O < x < œ er 0 Za e 
Oscilador harmônico simples “ 1 0 n? 1 

al = 0,1,...,—l < m < l são inteiros e —1 < x < 1,0 < x < 1 para Legendre deslocada. 


bA ortogonalidade de funções de Bessel é bastante especial. Compare com a Seção 11.2 para detalhes. Um segundo tipo de 
ortogonalidade é desenvolvido na Equação (11.174). 

€ k é um inteiro não-negativo. Para mais detalhes, veja a Tabela 10.2. 

“Isso formará a base para o Capítulo 14, série de Fourier. 


“Note que essa definição matemática do autovalor difere por um sinal da utilização em Física. 
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Exemplo 10.1.1 EQUAÇÃO DE LEGENDRE 
A equação de Legendre é dada por 


(1-2)u” 20 +n(n+Du=o0, -1<gq<l. (10.9) 


Pelas Equações (10.1), (10.8) e (10.9), 


polz)=1-22 =p, w(x) =1, 
pı(x) = -22 = p', A=n(n+1), 
pola) =0=q. 


Lembre-se de que nossas soluções de série da equação de Legendre (Exercício 9.5.5)” divergiam, a menos que n 
fosse restrito a um dos inteiros. Isso representa uma quantização do autovalor À. E 


Quando as equações do Capítulo 9 são transformadas para a forma auto-adjunta, encontramos os seguintes 
valores dos coeficientes e parâmetros (Tabela 10.1). O coeficiente p(x) é o coeficiente da derivada de segunda 
ordem da autofunção. O autovalor À é o parâmetro que está disponível em um termo da forma Aw(x)u(x);, qualquer 
dependência de x à parte a autofunção se torna a função de peso w(x). Se houver um outro termo que contenha 
a autofunção (não as derivadas), o coeficiente da autofunção nesse termo adicional é identificado como q(x). Se 
nenhum termo desses estiver presente, q(x) é zero. 


Exemplo 10.1.2  Dêureron 

Uma idéia mais detalhada dos conceitos de autofunção e autovalor pode ser dada por um modelo extremamente 
simples do dêuteron, um estado ligado de um nêutron e próton. Por experimentação, a energia de ligação de cerca 
de 2 MeV< Mc?, com M = Mp = Mn, a massa comum de nêutron e próton, cuja pequena diferença de massa 
desprezamos. Devido ao curto alcance da força nuclear, as propriedades do dêuteron não dependem muito da forma 
detalhada do potencial de interação. Assim, a interação nuclear nêutron-próton pode ser modelada por um poço de 
potencial quadrado esfericamente simétrico: V = Vo <Opara0<r<a,V = 0 para r > a. A equação de onda 
de Schrödinger é 


R? o2 = 
TA Y + Vy = Ey, (10.10) 


em que o autovalor de energia E < 0 para um estado ligado. Para o estado fundamental, o momento angular orbital 
l = 0 porque para | O há a barreira adicional de momento angular positivo. Assim, com 1) = y(r), podemos 
escrever u(r) = ry(r) e, usando o Exercício 2.5.18, a equação de onda se torna 


u 


T +kiu=0, (10.11) 

com M 
k? = (E -VW)>0 (10.12) 

para a faixa interna, 0 < r < a. Paraa < r < œo, temos 

du 

r kju = 0, (10.13) 
com 

à ME 

h=—2 >0. (10.14) 


A condição de fronteira de que 1) permaneça finito em r = 0 implica u(0) = 0 e 
u(r) = sen kir, 0O<r<a. (10.15) 
No intervalo fora do poço de potencial, temos uma combinação linear das duas exponenciais, 


us(r) = Aexp kər + Bexp(— kar), a<r<o. (10.16) 


Compare também com os Exercícios 5.2.15 e 12.10. 


“livro” — 2007/8/1 — 15:06 — page 473 — #483 


ELSEVIER 10. TEORIA DE STURM-LIOUVILLE — FUNÇÕES ORTOGONAIS 473 


A continuidade da densidade de partícula e de corrente exige que um(a) = us(a) e que ui (a) = us(a). Essas 
condições de junção ou compatibilidade resultam em 


sen kıa = Aexp ksa + Bexp(—ksa), (10.17) 
kı cos kıa = k2 A exp k2a — ksBexp(—koa). f 


A condição de que realmente tenhamos uma condição ligada próton-nêutron é que Je. u2(r) dr = 1. Esse vínculo 
pode ser cumprido se impusermos uma condição de contorno de que y(r) permaneça finita quando r — oo. E 
isso, por sua vez, significa que A = 0. Dividindo o par de equações precedentes (para cancelar B), obtemos 


kı E-VY 
g kia Em E” ( ) 


uma equação transcendental para a energia E com somente certas soluções discretas. Se E for tal que a 
Equação (10.18) pode ser satisfeita, nossas soluções uı(r) e uz(r) podem satisfazer as condições de contorno. 
Se a Equação (10.18) não for satisfeita, não existe nenhuma solução aceitável. Os valores de E para os quais a 
Equação (10.18) é satisfeita são os autovalores; as funções correspondentes, uı e uz (ou Y) são as autofunções. 
Para o problema do dêuteron existe um (e somente um) valor negativo de E que satisfaz a Equação (10.18); isto é, 
o dêuteron tem um e somente um estado ligado. 

Agora, o que acontece se E não satisfizer a Equação (10.18), isto é, se E 4 Eo não for um autovalor? Em forma 
gráfica, imagine que E e, portanto, kı sofram um ligeira variação. Para E = E, < Eo, kı é reduzido e senkja 
não virou para baixo o suficiente para se ajustar a exp(— ksa). As condições de junção, Equação (10.17), requerem 
que A > 0 e que a função de onda vá a +oo exponencialmente. Para E = E, > Eo, kı é maior, sen kıa alcança 
o pico mais cedo e desceu mais rapidamente em r = a. As condições de junção exigem que 4 < 0, e a função 
de onda vai a —co exponencialmente. Somente para E = Eo, um autovalor, a função de onda terá o requerido 
comportamento assintótico exponencial negativo (veja a Figura 10.1). E 


u(r) 


Figura 10.1: Uma autofunção de dêuteron. 


Condições de Contorno 
Na definição precedente de autofunção, notou-se que a autofunção u(x) tinha de satisfazer certas condições 
de fronteira impostas. O termo condições de contorno inclui o conceito de condições iniciais, como caso 
especial. Por exemplo, especificar a posição inicial x9 e a velocidade inicial vo em algum problema de dinâmica 
corresponderia às condições de contorno de Cauchy. A única diferença na presente utilização de condições de 
contorno nesses problemas unidimensionais é que vamos aplicar as condições sobre ambas as extremidades da 
faixa permitida para a variável. 

A forma da equação diferencial ou as condições de contorno determinadas para as soluções habitualmente 
garantirão que nas extremidades de nosso intervalo (isto é, na contorno, como sugerido pela Equação (10.3)) os 
seguintes produtos desaparecerão: 


p(a)v* (x) =0 e p(a)v* (x) = 0. (10.19) 
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Aqui u(x) e v(x) são soluções da EDO particular (Equação (10.8)) que está sendo considerada. Uma razão para 
essa forma particular da Equação (10.19) será sugerida em breve. Se recordarmos a função de onda radial u do 
átomo de hidrogênio com u(0) = 0 e du/dr ~ ek” — 0, quando r — oo, então ambas as condições de contorno 
são satisfeitas. De forma semelhante, no exemplo do dêuteron (Exemplo 10.1.2), sen kır — O quando r — 0 e 
d(e-*2") /dr — 0 quando r — œo, ambas as condições de contorno são obedecidas. Entretanto, podemos trabalhar 
com um conjunto um pouco menos restritivo de condições de contorno, 

v* pu’ = v*pu'| (10.20) 


r=a x=b” 


no qual u(x) e v(x) são soluções da equação diferencial correspondente aos mesmos autovalores ou a autovalores 
diferentes. A Equação (10.20) pode perfeitamente ser satisfeita se estivermos tratando com um sistema físico 
periódico, tal como uma rede cristalina. 

As Equações (10.19) e (10.20) são escritas em termos de v*, conjugado complexo. Quando as soluções são 
reais, v = v*, e o asterisco pode ser ignorado. Contudo, em expansões exponenciais de Fourier e em Mecânica 
Quântica as funções serão complexas e o conjugado complexo será necessário. 


Exemplo 10.1.3 — INTERVALO DE INTEGRAÇÃO [a, b] 
Para L = d? /dx?, uma possível equação de autovalor é 


d2 
qat) +n2u(x) = 0, (10.21) 
com autofunções 
Un = COS NT, Um = sen ma. 
A Equação (10.20) se torna 
b b 
—nsen masen ngj = 0, ou m COS MT cos na], =0, 


permutando wu, € Vm. Visto que sen ma e cosnx são periódicas com período 27 (para n e m inteiros), a 
Equação (10.20) é claramente satisfeita se a = xo e b = x9+27. Se um problema prescrever um intervalo diferente, 
as autofunções e autovalores mudarão juntamente com as condições de contorno. As funções sempre devem ser 
escolhidas de modo que as condições de contorno (Equação (10.20), etc.) sejam satisfeitas. Para esse caso (série 
de Fourier), as escolhas usuais são xo = 0, levando a (0,27) e xo = —7, levando a (— 7,7). Aqui, e em todos 
os outros vários capítulos, o intervalo de ortogonalidade é tal que as condições de contorno (Equação (10.20)) 
serão satisfeitas. O intervalo [a,b] e o fator de peso w(x) para as equações diferenciais de segunda ordem mais 


comumente encontradas estão relacionados na Tabela 10.2. E 
Tabela 10.2 

Equação a b w(x) 
Legendre -1 1 1 
Legendre deslocada 0 1 1 
Legendre associada -1 1 1 
Chebyshev I -1 1 (l-31? 
Chebyshev deslocada I 0 1 [e(l x) 
Chebyshev II -1 1 (Lopo 
Laguerre 0 00 e 
Laguerre associada 0 00 tee 
Hermite -00 0 er 
Oscilador harmônico simples 0 27 1 

-T T 1 


1. O intervalo de ortogonalidade [a,b] é determinado pelas condições de 
contorno da Seção 10.1. 

2. A função ponderação é estabelecida colocando a EDO em forma auto- 
adjunta. 
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Operadores Hermitianos 
Agora, vamos provar uma importante propriedade do operador diferencial de segunda ordem auto-adjunto 
(Equação (10.8)), em conjunto com soluções u(x) e v(x) que satisfazem condições de fronteira dadas pela 
Equação (10.20). Isso é motivado por aplicações em Mecânica Quântica. 

Integrando v* (conjugado complexo) vezes o operador diferencial de segunda ordem auto-adjunto £ (operando 
em u) no intervalo a < x < b, obtemos 


b b b 
| rtu (pu) de + | v*řžqu dx (10.22) 


usando a Equação (10.6). Integrando por partes, temos 
b É b 
I v* (puy da = v“pu' |o — I v*' pu dz. (10.23) 


A parte integrada desaparece com a aplicação das condições de contorno (Equação (10.20)). Integrando a integral 
remanescente por partes uma segunda vez, temos 


b b 
-f v*'pu’ dz = -o pue f u(pv*'y dz. (10.24) 


Mais uma vez, a parte integrada desaparece na aplicação da Equação (10.20). Uma combinação das 
Equações (10.22) a (10.24) nos dá 


b b 
ftuds= f u(Lv)* dz. (10.25) 


Essa propriedade, dada pela Equação (10.25), é expressa dizendo que o operador £ é hermitiano em relação às 
funções u(x) e v(x), que satisfazem as condições de contorno especificadas pela Equação (10.20). Note que, se 
essa propriedade hermitiana resultar da condição de ser auto-adjunta em um espaço de Hilbert, então ela inclui que 
as condições de contorno sejam impostas a todas as funções daquele espaço. 


Operadores Hermitianos em Mecânica Quântica 

O desenvolvimento desta seção focalizou os clássicos operadores diferenciais de segunda ordem da Física 
Matemática. Generalizando nossa teoria do operador hermitiano como exigido pela Mecânica Quântica, temos 
uma extensão: os operadores não precisam ser nem operadores diferenciais de segunda ordem, nem reais. py = 
—ih(0/0x) será um operador hermitiano. Simplesmente admitimos (como é costumeiro em Mecânica Quântica) 
que temos funções de onda que satisfazem condições de contorno adequadas: desaparecem com suficiente força 
no infinito ou têm comportamento periódico (como em uma rede cristalina ou intensidade unitária em problemas 
de espalhamento). O operador £ é denominado hermitiano se 


fica, dr = CAK? dr. (10.26) 


À parte a simples extensão para quantidades complexas, essa definição é idêntica à Equação (10.25). 
O adjunto A! de um operador A é definido por 


foiso dr= fear, dr. (10.27) 


Essa expressão generaliza nossa definição clássica de operadores orientados de derivada de segunda ordem da 

Equação (10.5). Aqui, o adjunto é definido em termos da integral resultante, com o At como parte do integrando. 

É claro que, se A = A? (auto-adjunto) e satisfaz as condições de contorno já mencionadas, então A é hermitiano. 
O valor esperado de um operador £ é definido como 


mz / y Eod (10.284) 


Na estrutura da Mecânica Quântica (£) corresponde ao resultado de uma medição da quantidade física 
representada por £ quando o sistema físico está em um estado definido pela função de onda 1). Se exigirmos 
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que £ seja hermitiano, é fácil mostrar que (£) é real (como seria de esperar de uma medição em uma teoria física). 
Tomando o conjugado complexo da Equação (10.28a), obtemos 


* 


(Ly = | ecvar] = [oc dr. 


Rearranjando os fatores no integrando, temos 


D= o (Eph dr. 


Então, aplicando nossa definição de operador hermitiano, Equação (10.26), obtemos 


(LY = / W' Ly dr = (£), (10.28b) 


ou (£) é real. Vale a pena observar que 4) não é necessariamente uma autofunção de £. 


Exercícios 


10.1.1 


10.1.2 


10.1.3 


10.1.4 


10.1.5 


10.1.6 


Mostre que a EDO de Laguerre, Equação (13.52), pode ser posta em forma auto-adjunta 
multiplicando por e77” e que w(x) = e77 é a função de peso. 
Mostre que a EDO de Hermite, Equação (13.10), pode ser posta em forma auto-adjunta 


multiplicando por e7?" e que isso dá w(x) = e7” 


como a função densidade adequada. 


Mostre que a EDO de Chebyshev (tipo I), Equação (13.100), pode ser posta em forma auto-adjunta 
multiplicando por (1 — x2)-!/2 e que isso dá w(x) = (1 — x2)-1/2 como a função densidade 
adequada. 


Mostre o seguinte quando a equação diferencial linear de segunda ordem é expressa em forma 
auto-adjunta: 


(a) O wronskiano é igual a uma constante dividida pelo coeficiente inicial p: 


C 
plz) 


W(x) = 


(b) Uma segunda solução é dada por 


x dt 
ya(a) = Coto) f TOROK 


Un (x), o polinômio de Chebyshev (tipo II), satisfaz a EDO, Equação (13.101), 


(1 — x°) U} (x) — 3U; (x) + n(n + 2)Un (x) = 0. 


(a) Localize os pontos singulares que aparecem no plano finito e mostre se são regulares ou 
irregulares. 

(b) Ponha essa equação em forma auto-adjunta. 

(c) Identifique o autovalor completo. 

(d) Identifique a função de peso. 


Para o caso muito especial A = 0 e q(x) = 0 a equação de autovalor adjunta se torna 


satisfeita por 


Use essa expressão para obter uma “segunda” solução para o seguinte: 


(a) Equação de Legendre, 


ELSEVIER 
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10.1.7 
10.1.8 


10.1.9 


10.1.10 


10.1.11 


10.1.12 


10.1.13 


10.1.14 


10.1.15 


10.1.16 


(b) Equação de Laguerre, 
(c) Equação de Hermite. 


1, 1 
Resposta: (a) uz(x) = = In Gato 


(b) u(x) — us(xo) = f a 


(c) uz(x) = a dt. 
0 


Essas segundas soluções ilustram o comportamento divergente encontrado em uma segunda 
solução. 
Nota: Em todos os três casos, ui (x) = 1. 


Dado que Lu = 0 e g£u é auto-adjunta, mostre que para o operador adjunto £, L(gu) = 0. 


Para um operador diferencial de segunda ordem £ que é auto-adjunto mostre que 


b 
b 
J iEn -vL do = phys = uni) 


Mostre que, se uma função 1 tiver de satisfazer a equação de Laplace em uma região finita do 
espaço e satisfazer condições de contorno de Dirichlet sobre toda a superfície fechada de ligação, 
então 1) é única. 
Sugestão: Uma das formas do teorema de Green, Seção 1.11, será útil. 
Considere que as soluções das equações de Legendre, Chebyshev, Hermite e Laguerre são 
polinômios. Mostre que os intervalos de integração que garantem que as condições de contorno 
do operador hermitiano serão satisfeitas são 
(a) Legendre [—1,1], (b) Chebyshev [1,1], 
(c) Hermite (—00,00), (d) Laguerre [0, 00). 
Dentro da estrutura da Mecânica Quântica (Equações (10.26) e seguintes), mostre que os seguintes 
operadores são hermitianos: 

h 
(a) momento p = —hV = E 

T 


(b) momento angular L = —iħr x V = —idir x V. 
Sugestão: Em forma cartesiana L é uma combinação linear de operadores hermitianos não- 
comutativos. 


(a) A é um operador não-hermitiano. No sentido das Equações (10.26) e (10.27), mostre que 
A+A e (A-A) 


são operadores hermitianos. 
(b) Usando o resultado precedente, mostre que todo operador não-hermitiano pode ser escrito como 
uma combinação de dois operadores hermitianos. 


U e V são dois operadores arbitrários, não necessariamente hermitianos. No sentido da 
Equação (10.27), mostre que 
(UV)! = viut. 
Note a semelhança com matrizes hermitianas adjuntas. 
Sugestão: Aplique a definição de operador adjunto, Equação (10.27). 


Prove que o produto de dois operadores hermitianos é hermitiano (Equação (10.26)) se, e somente 
se, os dois operadores comutarem. 


Ae B são operadores não-comutativos da Mecânica Quântica: 
AB — BA = iC. 


Mostre que C é hermitiano. Admita que as condições de contornos adequadas são satisfeitas. 


O operador £ é hermitiano. Mostre que (£?) > 0. 
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10.1.17 


10.1.18 


10.1.19 


10.1.20 


10.1.21 


10.1.22 


Um valor esperado da Mecânica Quântica é definido por 
(4) = [r'la)Av(a) da, 


em que A é um operador linear. Mostre que exigir que (A) seja real significa que A deve ser 
hermitiano, em relação a y(x). 


Pela definição de adjunto, Equação (10.27), mostre que Ai! = A no sentido de que 
JuwjAtiyo dr = f Y Ay, dr. O adjunto do adjunto é o operador original. 

Sugestão: As funções Yı e Y, da Equação (10.27) representam uma classe de funções. Os índices 
1 e 2 podem ser permutados ou substituídos por outros índices. 


A equação de onda de Schrôdinger para o dêuteron (com um potencial de Woods-Saxon) é 


Vo 
1 +expl(r — ro)/a] 


h2 
E 2 = Ey. 

av + 4 = Ey 
Aqui, E = —2,224 MeV, a é um “parâmetro de espessura”, 0,4 x 10-13 cm. Expressando 
comprimentos em fermis (10-13 em) e energias em milhões de elétron-volts (MeV), podemos 
reescrever a equação de onda como 


d? 1 Vo 
mar” E: 41,47 É 1 +exp((r — ro)/a) 


(ry) =0. 


Admite-se que E é conhecido por experimentação. A meta é achar Vo para um valor especificado 
de ro (digamos, ro = 2,1). Se fizermos y(r) = ry(r), então y(0) = 0 e consideramos y'(0) = 1. 
Ache Vo, tal que y(20,0) = 0. (Isso deveria ser y(00), mas r = 20 está distante o bastante da faixa 
das forças nucleares para se aproximar do infinito.) 


Resposta: Para a = 0,4 e ro = 2,1 fm, Vo = —34,159 MeV. 


Determine o parâmetro de poço de potencial nuclear Vo do Exercício 10.1.19 como uma função de 
ro para r = 2,00(0,05)2, 25 fermis. Expresse seus resultados como uma lei de potências 


Volro = k. 


Determine o expoente v e a constante k. Essa formulação de lei de potências é útil para interpolação 
precisa. 


No Exercício 10.1.19 admitimos que 20 fermis era uma boa aproximação de infinito. Verifique isso 
calculando Vo para ry(r) = 0 em (a) r = 15, (b) r = 20, (c) r = 25 e (d) r = 30. Esboce seus 
resultados. Considere ro = 2,10 e a = 0, 4 (fermis). 


Para uma partícula quântica em movimento em um poço de potencial, V (x) = imw?x?2, a equação 


2 
de onda de Schrödinger é 


PO VE), Lmutatw(a) = Byla), 
e dyz) 2E 
o — z(e) = -7 Y), 


em que z = (mw /ħ) 1/2, Uma vez que o operador é par, esperamos soluções de paridade definida. 
Para as condições iniciais a seguir, integre desde a origem e determine a constante mínima 2E /ħw 
que levará a (00) = 0 em cada caso. (Você pode considerar z = 6 uma aproximação do infinito.) 


(a) Para uma autofunção par, 


(b) Para uma autofunção ímpar, 
WO) =0,  W(0)=1. 


Nota: Soluções analíticas aparecem na Seção 13.1. 
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10.2 Operadores Hermitianos 


Operadores hermitianos, ou auto-adjuntos, com condições de contorno adequadas, têm três propriedades que são 
de extrema importância na Física, tanto clássica como quântica. 

1. Os autovalores de um operador hermitiano são reais. 

2. Um operador hermitiano possui um conjunto ortogonal de autofunções. 

3. As autofunções de um operador hermitiano formam um conjunto completo. 


Autovalores Reais 


Passamos a provar as duas primeiras dessas três propriedades. Seja 

Lu; + Awu; = 0. (10.29) 
Admitindo a existência de um segundo autovalor e autofunção, 

Lu; + Ajwu; = 0. (10.30) 
Então, tomando o conjugado complexo, obtemos 


Lu; + AGwu; = 0. (10.31) 
Aqui, w(x) > 0 é uma função real. Mas permitimos que Ax, os autovalores, e ug, as autofunções, sejam complexos. 
Multiplicando a Equação (10.29) por uù} e a Equação (10.31) por u; e então subtraindo, temos 


u; Lui — ul us = (A; — AJwuju;. (10.32) 


Integramos sobre o intervalo a < x < b: 


b b b 
u% Lui dx -f u;Ll* u} de = (A; — af uiujw dz. (10.33) 


Uma vez que £ é hermitiano, o lado esquerdo desaparece, pela Equação (10.26), e 


b 
(A; — ~) f u;ujw da = 0. (10.34) 
Se i = j, a integral não pode desaparecer [w(x) > 0, à parte pontos isolados], exceto no caso trivial de u; = 0. 
Daí, o coeficiente (À; — A;) deve ser zero, 


At = A, (10.35) 


KA 


o que diz que o autovalor é real. Uma vez que A; pode representar qualquer um dos autovalores, isso prova 
a primeira propriedade. Isso é exatamente análogo à natureza dos autovalores de matrizes reais simétricas (e 
hermitianas). (Compare com a Seção 3.5.) 

A análoga da decomposição espectral de uma matriz simétrica real na Seção 3.5 para um operador hermitiano 
£ com um conjunto discreto de autovalores A; adquire forma 


L= 3 Ailud luil, (£) = 3 FO ou) (uil 


com autovetores |u;) e qualquer função f infinitamente diferenciável. 

Autovalores reais de operadores hermitianos têm um significado fundamental em Mecânica Quântica, onde 
correspondem a quantidades mensuráveis com precisão como energia e momento angular. Sendo a teoria formulada 
em termos de operadores hermitianos, essa prova de autovalores reais garante que ela preverá números reais para 
essas quantidades físicas mensuráveis. Na Seção 17.8 veremos que o conjunto de autovalores reais tem um limite 
inferior (para problemas não-relativistas). 


“Essa terceira propriedade não é universal. Ela vale para nossos operadores diferenciais lineares de segunda ordem na forma (auto-adjunta) 
de Sturm-Liouville. A completude é definida e discutida na Seção 10.4. Uma prova de que as autofunções de nossas equações diferenciais 
lineares de segunda ordem auto-adjuntas formam um conjunto complexo pode ser desenvolvida pelo cálculo de variações da Seção 17.8. 
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Autofunções Ortogonais 


Se agora considerarmos i 4 j ese A; £ A; na Equação (10.34), a integral do produto de duas autofunções 
diferentes deve desaparecer: 


b 
I uuz w dz = 0. (10.36) 


Esta condição, denominada ortogonalidade, é o análogo contínuo de um produto escalar de dois vetores se 
anular” Dizemos que as autofunções u;(x) e uj(x) são ortogonais em relação à função de peso w(x) sobre 
o intervalo [a,b]. A Equação (10.36) constitui uma prova parcial da segunda propriedade de nossos operadores 
hermitianos. Mais uma vez deve ser notada a exata analogia com a análise matricial. De fato, podemos estabelecer 
uma correspondência um-para-um entre essa teoria de equações diferenciais de Sturm-Liouville e o tratamento de 
matrizes hermitianas. Essa correspondência tem sido historicamente significativa para estabelecer a equivalência 
matemática de matrizes mecânicas desenvolvidas por Heisenberg e a mecânica de ondulatória desenvolvida por 
Schrödinger. Hoje, as duas abordagens diversas estão fundidas na teoria da Mecânica Quântica, e a formulação 
matemática que for mais conveniente para um problema particular é usada para esse problema. Na verdade, 
as alternativas matemáticas não param por aqui. Equações integrais, Capítulo 16, são uma terceira abordagem 
equivalente e às vezes mais conveniente ou poderosa. 

Essa prova de ortogonalidade não é bem completa. Há um furo, porque podemos ter u;  u;, mas ainda 
assim ter A; = Aj. Tal caso é denominado degenerado. Ilustrações de degenerescência são dadas no final 
desta seção. Se A; = Aj, a integral na Equação (10.34) não precisa desaparecer. Isso significa que autofunções 
independentes correspondentes ao mesmo autovalor não são automaticamente ortogonais e que é preciso procurar 
algum outro método para obter um conjunto ortogonal. Embora as autofunções nesse caso degenerado possam não 
ser ortogonais, elas sempre podem ser transformadas em ortogonais. Na próxima seção desenvolvemos um método 
para fazer isso. Veja também a Equação (4.21) para degenerescência devida à simetria. 

Nos capítulos subsequentes veremos que ter um dado conjunto de funções ortogonais é exatamente tão desejável 
quanto ter um sistema de coordenadas ortogonais. Podemos trabalhar com funções não-ortogonais, mas elas 
provavelmente mostrarão ser tão confusas quanto um sistema de coordenadas oblíquas. 


Exemplo 10.2.1 SÉRIE DE FOURIER — ORTOGONALIDADE 
Continuando o Exemplo 10.1.3, a equação de autovalor, Equação (10.21), 
d? 2 
gar +n'y(z) =0, 


pode descrever quanticamente uma partícula dentro de uma caixa ou talvez uma corda de violino em vibração, um 
oscilador harmônico clássico com autofunções degeneradas — cos ng, sen nx — e autovalores n2, sendo n um 
inteiro. 

Com n real (aqui considerado inteiro), as integrais de ortogonalidade se tornam 


xo+27 
(a) 1 sen mg sen ng dx = Cnônm, 
xo 


xo+27 
(b) / cos mz cosnr de = Dnônm, 
zo 


xo+27 
(c) J sen ma cosng dx = 0. 
To 


Para um intervalo de 27, a análise precedente garante o delta de Kronecker em (a) e (b) mas não o zero em (c) 
porque (c) pode envolver autofunções degeneradas. Contudo, uma inspeção mostra que (c) sempre desaparece para 
todos os m e n inteiros. 


7Pela definição da integral de Riemann, 


b N 
f Fea = im > Kedger), 


zo = a,em que zy = bex;—x;-1 = Arx. Se interpretarmos f(x;) e g(x) como as i-ésimas componentes de um vetor de Ncomponentes, 
então esse somatório (e, portanto, essa integral) corresponde diretamente a um produto escalar de vetores, Equação (1.24). O produto escalar 
nulo é a condição para ortogonalidade dos vetores ou funções. 
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Nossa teoria de Sturm-Liouville nada diz sobre os valores de Cn e Dn porque EDOs homogêneas têm soluções 
cujo scaling é arbitrário. O cálculo propriamente dito resulta em 


T, n + 0, T, n F 0, 
Cn = Da = 
0, n=0, 27, n = 0. 
Essas integrais de ortogonalidade formam a base das séries de Fourier desenvolvidas no Capítulo 14. 


Exemplo 10.2.2 EXPANSÃO EM AUTOFUNÇÕES ORTOGONAIS — ONDA QUADRADA 

A propriedade de completude (veja a (Equação 1.190) e a Seção 10.4) significa que certas classes de funções 
(por exemplo, contínuas por seção ou contínuas por partes) podem ser representadas por uma série de autofunções 
ortogonais. Considere a forma de onda quadrada 


7 O<T<T, 
f(z) = h (10.37) 
-7 =y Lt LO: 
Essa função pode ser expandida em qualquer dentre uma variedade de autofunções — Legendre, Hermite, 


Chebyshev, e assim por diante. A escolha da autofunção é feita com base na conveniência ou em uma aplicação. 
Para ilustrar a técnica de expansão, vamos escolher as autofunções do Exemplo 10.2.1, cosna e sen nx. A série de 
autofunção é escrita, por conveniência (e por convenção), como 


fla) = > + se (am cos ma + by sen ma). 


m=1 


Multiplicando f(t) por cosnt ou sen nt e integrando, somente o enésimo termo sobrevive, pelas integrais de 
ortogonalidade do Exemplo 10.2.1, por isso resultando os coeficientes 


1 (7 1 [7 
An = — f(t) cos nt dt, ba = — f(t)sen nt dt, n=0,1,2... 
TJ ua NE 
Substituição direta de +h/2 por f(t) resulta em 
An = 0, 
o que é esperado aqui por causa da anti-simetria, f(—x) = — f (x), e 
0, n par, 
h 
bn = — (1 — cosnT) = $ op 
TIE —, n ímpar. 
na 
Daí, a expansão (Fourier) de autofunção da onda quadrada é 
2h «+ sen(2n + 1)x 
= ; 10.38 
MOS > 2n+1 Goa) 
Exemplos adicionais, usando outras autofunções, aparecem nos Capítulos 11 e 12. E 


Degenerescência 
O conceito de degenerescência já foi apresentado antes. Se N autofunções linearmente independentes 
correspondem ao mesmo autovalor, diz-se que o autovalor é N vezes degenerado. Uma ilustração particularmente 
simples é dada pelos autovalores e autofunções da equação do oscilador harmônico clássico, Exemplo 10.2.1. Para 
cada autovalor n?, há duas soluções possíveis: sen ng e cos nx (e qualquer combinação linear, sendo n um inteiro). 
Dizemos que as autofunções são degeneradas ou que o autovalor é degenerado. 

Um exemplo mais complicado é dado pelo sistema físico de um elétron em um átomo (tratamento não- 
relativista, desprezando o spin). Pela equação de Schrôdinger, Equação (13.84), para o hidrogênio, a energia 
total do elétron é nosso autovalor. Podemos denominá-lo E, rm usando os números quânticos n, L, e M como 
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índices. Para cada conjunto distinto de números quânticos (n, L, M) há uma autofunção linearmente independente 
WParm(r,0, p). Para o hidrogênio, a energia Enrm é independente de L e M, refletindo a simetria esférica (e 
SO(4)) do potencial de Coulomb. Com 0 < L<n-le-L<M< L, o autovalor é n? vezes degenerado (incluir 
o spin do elétron elevaria esse fator para 2n?). Em átomos com mais de um elétron, o potencial eletrostático não 
é mais um simples potencial r”!. A energia depende de L tanto quanto de n, embora não de M; Enz m ainda é 
(2L + 1) vezes degenerescência. Essa degenerescência — devida à invariância rotacional do potencial — pode 
ser removida aplicando-se um campo magnético externo, quebrando a simetria esférica e dando origem ao efeito 
de Zeeman. Como regra, as autofunções formam um espaço de Hilbert, isto é, um espaço vetorial completo de 
funções com uma métrica definida pelo produto interno (veja a Seção 10.4 para mais detalhes e exemplos). 

Muitas vezes uma simetria subjacente, tal como invariância rotacional, está causando as degenerescências. 
Estados que pertencem ao mesmo autovalor de energia então formarão um multipleto ou representação do grupo 
de simetria. Os poderosos métodos teóricos de grupos são tratados no Capítulo 4 com certo detalhe. 


Exercícios 
10.2.1 As funções wu (x) e us(x) são autofunções do mesmo operador hermitiano, mas para valores 
autovalores distintos A; e A2. Prove que w (x) e uz(x) são linearmente independentes. 
10.2.2 (a) Os vetores e, são ortogonais um ao outro: e, - em = 0, para n Æ m. Mostre que eles são 
linearmente independentes. 
(b) As funções 1, (x) são ortogonais uma à outra no intervalo |a, b| e em relação à função de pesos 
w(x). Mostre que as 1), (x) são linearmente independentes. 


10.2.3 Dado que 


Bits «cb OE zm( 1) 


são soluções da equação diferencial de Legendre correspondentes a diferentes autovalores: 


(a) Avalie sua integral de ortogonalidade 


2 


(b) Explique por que essas duas funções não são ortogonais, isto é, por que a prova de 
ortogonalidade não se aplica. 
10.2.4 To(x) = 1 e Vi(x) = (1 — z?)!/2 são soluções da equação diferencial de Chebyshev 
correspondentes a diferentes autovalores. Explique, em termos das condições de contorno, por que 
essas duas funções não são ortogonais. 


10.2.5 (a) Mostre que as derivadas de primeira ordem dos polinômios de Legendre satisfazem a equação 
diferencial auto-adjunta com autovalor A = n(n + 1) — 2. 
(b) Essas derivadas de polinômios de Legendre satisfazem uma relação de ortogonalidade 


k PAP (1 — x°) dx = 0, mn. 


Nota: Na Seção 12.5 (1 — w2)!/2 P! (x) será denominado polinômio associado de Legendre, P! (x). 


10.2.6 Um conjunto de funções un (x) satisfaz a equação de Sturm-Liouville 


d d 

— COAG] + ànw(z)un(x) = 0. 

da da 

As funções um(1) e un(x) satisfazem condições de contorno que levam à ortogonalidade. Os 
autovalores correspondentes Am e A, são distintos. Prove que, para condições de contorno 


adequadas, u/ (1) e u/ (x) são ortogonais com p(x) como uma função de peso. 


10.2.7 — Um operador linear A tem n autovalores distintos e n autofunções correspondentes: Ay, = A;y,. 
Mostre que as n autofunções são linearmente independentes. A não é necessariamente hermitiano. 
Sugestão: Admita dependência linear — que 1), = aa a;y;. Use essa relação e a equação de 
autofunção de operador, primeiro em uma ordem e então na ordem inversa. Mostre que resulta uma 
contradição. 
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10.2.8 (a) Mostre que a substituição de Liouville 


do) = Olou, e= f [55] a 
transforma 
E pla) Ea] + pwe) - saluo =0 
e D- QU =0; 
En 


(b) Se wm(£) e v2(£) forem obtidos por w (x) e u(x), respectivamente, por uma substituição 


2 


de Liouville, mostre que f? w(a)usuzda é transformada em fy w(E)va(£) dE com 
c= Pde 
alp 
10.2.9 Os polinômios ultra-esféricos c (x) são soluções da equação diferencial 


fa — DEn — (2a + rd + mín + 20) JePe) =0. 


(a) Transforme essa equação diferencial para a forma auto-adjunta. 
(b) Mostre que os c (x) são ortogonais para n diferentes. Especifique o intervalo de integração 
e o fator de peso. 


Nota: Admita que suas soluções são polinômios. 


10.2.10 Com £ não auto-adjunto, 


Lv; + Ajwv; = 0. 


484 
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10.2.11 


10.2.12 


10.2.13 


10.2.14 


(a) Mostre que 
b b 
f vjLu; dz = u;Luj dz, 


jb jb 
UiPov; IN = vjpou;|, 


contanto que 


b 
uipi -= pov;l, =0. 


(b) Mostre que a integral de ortogonalidade para as autofunções u; e vj se torna 


b 


No Exercício 9.5.8 constata-se que a solução de série da equação de Chebyshev é convergente para 

todos os autovalores n. Portanto, n não é quantizado pelo argumento usado para a equação de 

Legendre (Exercício 9.5.5). Calcule a soma da série de Chebyshev da equação indicial k = O para 

n = v = 0,8,0,9, e 1,0 e para z = 0,0(0,1)0,9. 

Nota: A relação de recorrência da série de Chebyshev é dada no Exercício 5.2.16. 

(a) Avalie a n = v = 0,9, série de Chebyshev da equação indicial k = 0, para x = 0,98, 0,99, e 
1,00. A série converge muito lentamente em x = 1,00. Talvez você queira usar precisão dupla. 
Limites superiores para o erro de seu cálculo podem ser estabelecidos por comparação com o 
caso de v = 1,0 que corresponde a (1 — w2)!/2, 

(b) Essas soluções de série para autovalor v = 0, 9 e para v = 1,0 são obviamente não-ortogonais, 
a despeito do fato de satisfazerem a equação de autovalor auto-adjunta com autovalores 
diferentes. Pelo comportamento das soluções na vizinhança e x = 1, 00, tente formular uma 
hipótese para o fato de a prova de ortogonalidade não se aplicar. 


A expansão de Fourier da onda quadrada (assimétrica) é dada pela Equação (10.38). Com h = 2, 
avalie essa série para x = 0(7/18)7/2, usando os primeiros (a) 10 termos, (b) 100 termos da série. 
Nota: Para 10 termos e x = 7/18, ou 10º, sua representação de Fourier tem uma protuberância 
acentuada. Esse é o fenômeno de Gibbs da Seção 14.5. Para 100, termos essa protuberância se 
deslocou de aproximadamente 1º. 


A onda quadrada simétrica 


tem uma expansão de Fourier 


de= 4 sx teia toa. 


n=0 
Avalie essa série para x = 0(m/18)7/2 usando os primeiros (a) 10 termos, (b) 100 termos da série. 


Nota: Assim como no Exercício 10.2.13, o fenômeno de Gibbs aparece na descontinuidade. Isso 
significa que uma série de Fourier não é adequada para trabalho numérico de precisão na vizinhança 
de uma descontinuidade. 


10.3 Ortogonalização de Gram-Schmidt 


A ortogonalização de Gram-Schmidt é um método que considera um conjunto não-ortogonal de vetores (veja a 
Seção 3.1) ou funções linearmente independentes? e constrói um conjunto ortogonal de vetores ou funções em um 


$Tal conjunto de funções pode perfeitamente surgir das soluções de uma EDP na qual o autovalor era independente de uma ou mais das 
constantes de separação. Como exemplo, temos o problema do átomo de hidrogênio (Seções 10.2 e 13.2). O autovalor (energia) é independente 
do momento angular orbital do elétron e também de sua projeção sobre o eixo z-axis, m. Entretanto, note que a origem do conjunto de funções 
é irrelevante para o procedimento de ortogonalização de Gram-Schmidt. 
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intervalo arbitrário e com relação a um peso arbitrário ou fator de densidade. Na linguagem da Álgebra Linear, o 
processo é equivalente a uma transformação matricial que relaciona um conjunto ortogonal de vetores (funções) 
de base a um conjunto não-ortogonal. Um exemplo específico dessa transformação de matriz aparece no Exercício 
12.2.1. 

Em seguida, aplicamos o procedimento de Gram-Schmidt a um conjunto de funções. As funções envolvidas 
podem ser reais ou complexas. Aqui, por conveniência, admitimos que são reais. A generalização para o caso 
complexo não oferece nenhuma dificuldade. 

Antes de atacarmos a ortogonalização, devemos considerar a normalização de funções. Até agora, nenhuma 
normalização foi especificada. Isso significa que 


b 
/ piwdr = N?, 
a 


mas nenhuma atenção foi dada ao valor de N;. Uma vez que nossa equação básica (Equação (10.8)) é linear 
e homogênea, podemos multiplicar nossa solução por qualquer constante e ela ainda será uma solução. Agora 
exigimos que cada solução qy; (x) seja multiplicada por N}, de modo que a nova y; (normalizada) satisfará 


b 
/ vi (x)w(x) de = 1 (10.39) 


b 
f pilx)p;(x)w(z) dr = ĝij. (10.40) 


A Equação (10.39) diz que normalizamos para a unidade. Incluindo a propriedade da ortogonalidade, temos a 
Equação (10.40). Diz-se que funções que satisfazem essa equação são ortonormais (ortogonais mais normalização 
para unidade). É claro que outras normalizações são possíveis e, de fato, por convenção histórica, cada uma das 
funções especiais da física matemática tratadas nos Capítulos 12 e 13 será normalizada de forma diferente. 

Consideramos três conjuntos de funções: um dado conjunto original, linearmente independente 
Un(£), n = 0,1,2,...; um conjunto ortogonalizado 4), (x) a ser construído; e um conjunto final de funções q, (x), 
que são as 1), normalizadas. As u, originais podem ser autofunções degeneradas, mas isso não é necessário. 
Teremos as seguintes propriedades: 


Un (2º) PaT) Prlz) 

Linearmente independente Linearmente independente Linearmente independente 
Não-ortogonal Ortogonal Ortogonal 
Não-normalizada Não-normalizada Normalizada (ortonormal) 


O procedimento de Gram-Schmidt considera a enésima função 1) (1), ) como un (x) mais uma combinação linear 
da «o anterior. A presença da nova u, (1) garantirá independência linear. O requisito de que 1), (x) seja ortogonal 
a cada uma das anteriores resulta em limitações apenas suficientes para determinar cada um dos coeficientes 
desconhecidos. Então a 1), totalmente determinada será normalizada para unidade, resultando em q, (x). Então a 
sequência de etapas é repetida para Y), (1). 

Começamos com n = 0, fazendo 


polz) = uo(x), (10.41) 
sem nenhum ọ “anterior” para nos incomodar. Então normalizamos 
polz 
Polx) = olz) (10.42) 


[S pow dz]*/2 


Para n = 1, seja 
Wi(a) = u (z) + a1,0p0(2). (10.43) 


Impomos que (x) seja ortogonal a yọ(x). (Nesse estágio a normalização de y,(x) é irrelevante.) Essa 
ortogonalidade leva a 


fies dz = fiw dotaro | gw dz = 0. (10.44) 
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Uma vez que yọ é normalizada para unidade (Equação (10.42)), temos 


01,0 = - f uow dx, (10.45) 


fixando o valor de a, 0. Normalizando, definimos 


at. F as E (10.46) 
Por fim, generalizamos, de modo que 
AO = Tea R 
em que 
vila) = ui + ai opo + Map ++ dii-i (10.48) 
Os coeficientes a;,; são dados por 
Qij = - fuso dz. (10.49) 


A Equação (10.49) é válida para normalização para unidade. Se for selecionada alguma outra normalização, 


b 
f Leto] o(a) de= n}, 


então a Equação (10.47) é substituída por 


o Vila) 
Pilx) = Todo (10.47a) 
e Qi j SE torna 
J uipjw da 
aj oi (10.494) 
Nî 


As Equações (10.48) e (10.49) podem ser reescritas em termos de operadores de projeção, Pj. Se considerarmos 
que as , (1) formam um espaço vetorial linear, então a integral na Equação (10.49) pode ser interpretada como a 
projeção de u; sobre a p; “coordenada” ou a j-ésima componente de u;. Com 


Pula) = | f ueo dt besta) 
a Equação (10.48) se torna 
1—1 
vila) = E -rhuo (10.48a) 
j=1 


Subtrair as componentes, j = 1 a į — 1, nos fornece 1);(x:) ortogonal a todas as y}(x). 

É bom observar que, embora esse procedimento de Gram-Schmidt seja um modo possível de construir um 
conjunto ortogonal ou ortonormal, as funções y; (x) não são únicas. Há um número infinito de possíveis conjuntos 
ortonormais para um dado intervalo e uma dada função densidade. 

Para ilustrar a liberdade envolvida, considere dois vetores (não-paralelos) A e B no plano xy. Podemos 
normalizar A para grandeza unitária e então formar B’ = aA + B, de modo que B’ seja perpendicular a A. 
Normalizando B’ concluímos a ortogonalização de Gram-Schmidt para dois vetores. Mas quaisquer dois vetores 
unitários perpendiculares, tais como Å e ŷ, poderiam ter sido escolhidos como nosso conjunto ortonormal. Mais 
uma vez, com um número infinito de possíveis rotações de X e ý em torno do eixo z, temos um número infinito de 
conjuntos ortonormais possíveis. 
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Exemplo 10.3.1 . Porinômios DE LEGENDRE POR ORTOGONALIZAÇÃO DE GRAM-SCHMIDT 
Vamos formar um conjunto ortonormal a partir do conjunto de funções un(1) = z”, n = 0,1,2... O intervalo é 
—1 < x < 1 e a função densidade é w(x) = 1. 

De acordo com o processo de ortogonalização de Gram-Schmidt descrito, 


1 
uo =], por conseguinte, Ppi = == (10.50) 
v2 
Então, i 
t) = z Faro 10.51 
p(z) A ( ) 
e 
ad 
1,0 = -f —dr = 0 (10.52) 
-1 V2 


por simetria. Normalizamos 1), para obter 


3 
pila) = Ja (10.53) 


Então continuamos o procedimento de Gram-Schmidt com 


1 3 
2 
a)=1r+aso—=+a =f, 10.54 
palz) 2077 "yo ( ) 
em que 
1,2 Z 
ny 
= dz = 10.55 
a2,0 Í. R T (10.55) 
1 3 
a21 = -f TE dx = 0, (10.56) 
—ı V2 
mais uma vez por simetria. Portanto, 
1 
Vala) = 2°- 5, (10.57) 


e, normalizando para unidade, temos 

plx) = n (3 -1). (10.58) 
A próxima função, y3(x), se torna 

pa(x)=4/5- (50º — 32). (10.59) 


Referindo-nos ao Capítulo 12, mostramos que 


Pale) =4/ mi Pia); (10.60) 


em que P(x) é o polinômio de Legendre de enésima ordem. Nosso processo de Gram-Schmidt nos apresenta 
um método possível, porém muito desajeitado, de gerar os polinômios de Legendre. O processo ilustra como uma 
expansão de série em un (1) = x”, que não é ortogonal, pode ser convertida em uma série ortogonal. E 


As equações para a ortogonalização de Gram-Schmidt tendem a ser mal condicionadas por causa das subtrações, 
Equações (10.48) e (10.49). Uma técnica para evitar essa dificuldade utilizando a relação de recorrência de 
polinômios é discutida por Hamming.’ 

No Exemplo 10.3.1 especificamos um intervalo de ortogonalidade [—1, 1], uma função de peso unitária e um 
conjunto de funções x” que serão tomadas uma por vez em ordem crescente. Dadas todas essas especificações, o 
procedimento de Gram-Schmidt é único (dentro de um fator de normalização e um sinal global, como discutiremos 
a seguir). Nosso conjunto ortogonal resultante, os polinômios de Legendre, Po até Ph, formam um conjunto 
completo para a descrição de polinômios de ordem < n no intervalo [—1,1]. Esse conceito de completude é 
retomado com detalhes na Seção 10.4. Expansões de funções em séries de polinômios de Legendre são encontradas 
na Seção 12.3. 


9R. W. Hamming, Numerical Methods for Scientists and Engineers, 2% ed., Nova York: McGraw-Hill (1973). Veja a Seção 27.2 e referências 
ali encontradas. 
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Polinômios Ortogonais 


O Exemplo 10.3.1 foi escolhido com a estrita finalidade de ilustrar o procedimento de Gram-Schmidt. Embora 
ele tenha a vantagem de apresentar os polinômios de Legendre, as funções iniciais u, = x” não são autofunções 
degeneradas e não são soluções da equação de Legendre. Elas são simplesmente um conjunto de funções que 
rearranjamos aqui para criar um conjunto ortonormal para o intervalo dado e para a função de peso dada. O fato 
de termos obtido os polinômios de Legendre não é bem um passe de mágica, mas uma conseqiiência direta da 
escolha do intervalo e da função de peso. A utilização de un(x) = x”, porém com outras escolhas de intervalo e 
de funções de peso, leva a outros conjuntos de polinômios ortogonais, como mostra a Tabela 10.3. Fazemos um 
estudo detalhado desses polinômios nos Capítulos 12 e 13 como soluções de equações diferenciais particulares. 


Tabela 10.3 Polinômios ortogonais gerados por ortogonalização de Gram-Schmidt de un (x) = xz”, n = 0,1,2,... 


Função 
Polinômios Intervalo de peso w(x) Normalização padrão 
T 
2 
Legend -1<a<l 1 Pa (£)]? dx = 
egendre Sons no n (x)| da FEE] 
1 
1 
Legendre deslocada 0O<a<l 1 / [P* (a)]? da = 
0 2n + 1 
PL [Ta(£)]? 2 0 
e L m-1/2 [Th Jr? n# 
Chebyshev I l<r<l (1— x?) A U37 27 dg i i o 
1 T* 2 
Chebyshev deslocada I 0O<zr<1 [z(1 — x) 71/2 / Biol =; = [ is m 7 0 
o, [e(1 — æ)]"/ Ma wN 
Chebyshev II -1<z<1 (1 — x2)1/2 [Un (2)]2 (1 — x?)!/2 dz = 3 
=i 
[e.e] 
Laguerre 0<gz< œ e” l [Ln(£)] e7? dz = 1 
o 
ee : k)! 
Laguerre associada 0O<gz< œ ate / [LE (x)|? xe? da = EEI 
0 n! 
oo 
Hermite —00 < T < œ e72’ I [Hn (x)2e—*? dx = Wa! 
—oo 


Um exame desse processo de ortogonalização revelará duas características arbitrárias. Primeiro, como já 
salientamos antes, não é necessário normalizar as funções para unidade. No exemplo que acabamos de dar, 
poderíamos ter requisitado 


2n+41 


1 
f en(o)em(a) do — : Ori (10.61) 
1 


e o conjunto resultante seriam que os próprios polinômios de Legendre. Em segundo lugar, o sinal de «, é sempre 
indeterminado. No exemplo escolhemos o sinal exigindo que o coeficiente da potência mais alta de x fosse positivo. 
Para os polinômios de Laguerre, por outro lado, exigiríamos que o coeficiente da potência mais alta fosse (— 1)” /n! 


Exercícios 


10.3.1 | Volte ao Exemplo 10.3.1 e substitua (o, (x) pelo polinômio convencional de Legendre, P, (x): 


Usando as Equações (10.47a) e (10.494), construa Po, Pı (x), e Po(a). 


Resposta: P =1, P =x, P= Sa? Sd 


E 
10.3.2 | Seguindo o procedimento de Gram-Schmidt, construa um conjunto de polinômios PX (x) ortogonal 
(fator de ponderação unitário) na faixa [0, 1] a partir do conjunto [1, £]. Normalize de modo que 
P(D=1. 
Resposta: P*(x) = 1, 
Pi(r)=2x-1, 
Pi(a)= 6x? — 6x + 1, 
Pł (x) = 20x — 30x? + 12x — 1. 


ELSEVIER 
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10.3.3 


10.3.4 


10.3.5 


10.3.6 


10.3.7 


Esses são os primeiros quatro polinômios deslocados de Legendre. 
Nota: O símbolo “*” é o padrão para “deslocado”: [0, 1] em vez de [—1, 1]. Não significa conjugado 
complexo. 


Aplique o procedimento de Gram-Schmidt para formar os três primeiros polinômios de Laguerre 


Uni) = ms n=0,1,2,..., 0O<a<o, wlr) = e”. 
A normalização convencional é 
/ Lm(x)Ln(x)e" de = ômn- 
0 
2-4 2 
Resposta: Lo = 1, Lyj=(1-1), L= a E 


Dados 

(a) um conjunto de funções un (x) = z”, n = 0,1,2,..., 

(b) um intervalo (0, 00), 

(c) uma função de peso w(x) = xe””, use o procedimento de Gram-Schmidt para construir as 
primeiras três funções ortonormais do conjunto wu, (1) para esse intervalo e essa função peso. 


ela) = (2 —2)/V2, o(a) = (2? — 6x + 6)/2v3. 
Usando o procedimento de ortogonalização de Gram-Schmidt, construa os três mais baixos 
polinômios de Hermite 


Resposta: po(x) = 1, 


Unla) = 4”, n=0,1,2,..., —00 < £ < œ, 


Para esse conjunto de polinômios, a normalização usual é 
i Hm(£)Ha(£)w(£) de = mn?” mini", 
Hı = 2z, Hə = 4z? — 2. 


Use o esquema de ortogonalização de Gram-Schmidt para construir os primeiros três polinômios 
de Chebyshev (tipo I): 


Resposta: Ho = 1, 


Una) = x”, n=0,1,2,..., —I<ar<l, w(z) = (1— 12) 2, 
considere a normalização 
1 T, m=n=0, 
IESO OTOL = ôma 4 7 
= Ea m=n>1 
2 
Sugestão: As integrais necessárias são dadas no Exercício 8.4.3. 
Resposta: To =1, T=, T=27º-1 (Tz = 4r? — 32x). 


Use o esquema de ortogonalização de Gram-Schmidt para construir os três primeiros polinômios 
de Chebyshev (tipo II): 


unz) =£", n=012..0, -1<z<1,  w(z)=(1- r)". 

Considere a normalizarão como 

E T 

i Um(x)Un(x)w(x) de = ômn 5 

—1 
Sugestão: 

1 
1-3-5- (2n— 1) 
1 — x?) 2º dr = =1,2,3,... 
a ja osso dna da 
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Resposta: Uo = 1, U = 2r, U = 4z? -— 1. 
10.3.8 — Como uma modificação do Exercício 10.3.5, aplique o procedimento de ortogonalização de Gram- 
Schmidt ao conjunto un (x) = z”, n = 0,1,2,...,0 < « < œœ. Considere w(x) como exp|—z?]. 
Ache os dois primeiros polinômios que não se anulam. Normalize de modo que o coeficiente 
da potência mais alta de x seja a unidade. No Exercício 10.3.5 o intervalo (—o0, 00) levou aos 
polinômios de Hermite. Sem dúvida, esses não são os polinômios de Hermite. 
Resposta: vo = 1, py=2-1 12, 
10.3.9 Forme um conjunto ortogonal no intervalo O < x < co, usando un(x) = e°”, n = 1,2,3,... 
Considere o fator de peso, w(x), como a unidade. Essas funções são soluções de u —n2u, = 0, que 
já estão claramente na forma (auto-adjunta) de Sturm-Liouville. Por que a teoria de Sturm-Liouville 
não garante a ortogonalidade dessas funções? 


10.4 Completude de Autofunções 


A terceira propriedade importante de um operador hermitiano é que suas autofunções formam um conjunto 
completo. Essa completude significa que qualquer função bem-comportada (ao menos contínua por partes) F(x) 
pode ser aproximada por uma série 


F(x) = X` anpn(z) (10.62) 
n=0 


com qualquer grau de precisão desejado.!º Mais exatamente, o conjunto , (x) é denominado completo!! se o 
limite do erro médio quadrático desaparecer: 


b m 2 
lim F(x) — 5 anpn(x)| w(a) de = 0. (10.63) 
a n=0 


m—00 


Tecnicamente, aqui a integral é a integral de Lebesgue. Não exigimos que o erro desapareça identicamente em 
[a, b], mas apenas que a integral do erro ao quadrado vá a zero. 

Essa convergência da média, Equação (10.63), deve ser comparada com a convergência uniforme (Seção 5.5, 
Equação (5.67). É claro que convergência uniforme implica convergência da média, mas o inverso não é 
verdadeiro; a convergência da média é menos restritiva. Especificamente, a Equação (10.63) não é perturbada 
por funções contínuas por partes com apenas um número finito de descontinuidades finitas. Um exemplo relevante 
é o fenômeno de Gibbs da série descontínua de Fourier discutido na Seção 14.5, que ocorre também para outras 
séries de autofunções. 

A Equação (10.63) é perfeitamente adequada para nossas finalidades e é muito mais conveniente do que a 
Equação (5.67). De fato, visto que fregiientemente usamos autofunções para descrever funções descontínuas, a 
convergência da média é tudo o que podemos esperar. 

Na Equação (10.62) os coeficientes de expansão am podem ser determinados por 


b 
Am = f F(x) (x)w(x) de. (10.64) 


Essa expressão resulta da multiplicação da Equação (10.62) por yž,(x)w(x) e integração. Pela ortogonalidade 
das autofunções p, (x), somente o m-ésimo termo sobrevive. É aqui que vemos o valor da ortogonalidade. A 
Equação 10.64 pode ser comparada com o produto escalar ou interno de vetores, Seção 1.3, e am interpretada 
como a m-ésima projeção da função F'(x). O coeficiente am costuma ser denominado coeficiente generalizado 
de Fourier. 

Para uma função conhecida F(x), a Equação (10.64) dá am como uma integral definida que sempre pode ser 
avaliada, por computador, se não analiticamente. 

Na linguagem da Álgebra Linear, temos um espaço linear, um espaço de função vetorial. As funções ortonormais 
linearmente independentes 2, (x) formam a base para esse espaço (de infinitas dimensões). A Equação (10.62) é 
uma afirmação de que as funções y(x) espaço linear. Com um produto interno definido pela Equação (10.64), 
nosso espaço linear é um espaço de Hilbert. 


10Se temos um conjunto finito, como é o caso de vetores, o somatório é sobre o número de membros linearmente independentes do conjunto. 
! Nesse caso há muitos autores que usam o termo fechado. 
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Estabelecendo a função de peso como w(x) = 1 por simplicidade, a completude em forma de operador para 
um conjunto discreto de autofunções |;) se torna 


25 pi) (pi) = 1. 


Multiplicando a relação de completude por |F}, obtemos a expansão em autofunções 


|F) =D leer) 


com o coeficiente de Fourier generalizado a; = (;|F). De modo equivalente, em representação coordenada, 


implica 


r(o)= | Poe- y)dy =D eo) f oito) Pg) ds 


Sem prova, afirmamos que o espectro de um operador linear A que mapeia um espaço de Hilbert H para 
si mesmo pode ser dividido em um espectro discreto (ou pontual) com autovetores de comprimento finito, um 
espectro contínuo, de modo que a equação de autovalor Av = Av com v em H não tem uma inversa limitada única 
(A — À)! em um domínio denso de H e um espectro residual em que (A — A)! não tem limite em um domínio 
não-denso em H. 

A questão de completude de um conjunto de funções muitas vezes é determinada por comparação com uma 
série de Laurent, Seção 6.5. Na Seção 14.1 isso é feito para séries de Fourier, estabelecendo assim a completude da 
série de Fourier. Para todos os polinômios ortogonais mencionados na Seção 10.3 é possível achar uma expansão 
de polinômio de cada potência de z, 


z” = X tania, (10.65) 
1=0 


em que P;(z) é o i-ésimo polinômio. Os Exercícios 12.4.6, 13.1.6, 13.2.5 e 13.3.22 são exemplos específicos da 
Equação (10.65). Usando a Equação (10.65), podemos expressar novamente a expansão de Laurent de f(z) em 
termos de polinômios, mostrando que a expansão de polinômio existe (quando existe, é única, Exercício 10.4.1). 
A limitação desse desenvolvimento de série de Laurent é que ele requer que a função seja analítica. As 
Equações (10.62) e (10.63) são mais gerais. F(x) pode ser somente contínua por partes. Numerosos exemplos da 
representação dessas funções contínuas por partes aparecem no Capítulo 14 (série de Fourier). Uma prova de que 
nossas autofunções de Sturm-Liouville formam séries completas aparece em Courant e Hilbert.!? Para exemplos 
de expansões em autofunção particulares, consulte os seguintes: séries de Fourier, Seção (10.2) e Capítulo 14; 
expansões de Bessel e de Fourier-Bessel, Seção 11.2; séries de Legendre, Seção 12.3; séries de Laplace, Seção 
12.6; séries de Hermite, Seção 13.1; séries de Laguerre, Seção 13.2; e séries de Chebyshev, Seção 13.3. Pode 
também acontecer de a expansão em autofunções, Equação (10.62), ser a expansão de uma F(x) desconhecida 
em uma série de autofunções conhecidas (p, (1) com coeficientes desconhecidos an. Um exemplo seria a tentativa 
do químico quântico de descrever uma função de onda molecular (desconhecida) como uma combinação linear de 
funções de ondas atômicas conhecidas. Os coeficientes desconhecidos a, seriam determinados por uma técnica 
variacional-Rayleigh-Ritz, Seção 17.8. 


Desigualdade de Bessel 

Se o conjunto de funções o, (1) não formar um conjunto completo, possivelmente porque nós simplesmente não 
incluímos o exigido número infinito de membros de um conjunto infinito, somos levados à desigualdade de Bessel. 
Em primeiro lugar, considere o caso finito da análise vetorial. Seja A um vetor de n componentes, 


A=eja tesao +`: + Enan, (10.66) 


2R. Courant e D. Hilbert, Methods of Mathematical Physics (tradução para o inglês), vol. 1, Nova York: Interscience (1953), nova tiragem, 
Wiley (1989), Capítulo 6, Seção 3. 
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no qual e; é um vetor unitário e a; é a componente correspondente (projeção) de A; isto é, 
a;=A -e;. (10.67) 


Então, 


2 
(a = y era) >0. (10.68) 


Se somarmos sobre todas as n componentes, o somatório é claramente igual a A pela Equação (10.66) e 
a igualdade é válida. Contudo, se o somatório não incluir todos os n componentes, resulta a desigualdade. 
Expandindo a Equação (10.68) e escolhendo os vetores unitários de modo a satisfazer uma relação de 
ortogonalidade, 


e€; : e; = Õij, (10.69) 


temos 
A?>S aj. (10.70) 


Essa é a desigualdade de Bessel. 
Para funções reais, consideramos a integral 


4 [to pp ut (x) de > 0. (10.71) 


Esse é o contínuo análogo à Equação (10.68), deixando que n — oo, e substituindo o somatório se anuala por 
uma integração. Mais uma vez, com o fator de peso w(x) > 0, o integrando é não-negativo. A integral se anula 
pela Equação (10.62) se tivermos um conjunto completo. Caso contrário, ela é positiva. Expandindo o termo ao 
quadrado, obtemos 


b b 
/ [f(a)] “w(x) da — 2 5 a f f(x)pi(x)w(x)dx + 5 a? > 0. (10.72) 
Aplicando a Equação (10.64), temos 


b 
MUOKOLEDIC (073) 


Daí, a soma dos quadrados dos coeficientes de expansão a; é menor ou igual à integral ponderada de [f(x)]2, 
sendo que a igualdade é válida se, e somente se, a expansão for exata, isto é, se o conjunto de funções y,, (x) for 
um conjunto completo. 
Em capítulos posteriores, quando considerarmos autofunções que formam conjuntos completos (tais como 
polinômios de Legendre), a Equação (10.73) com o sinal de igual valendo será denominada relação de Parseval. 
A desigualdade de Bessel tem uma variedade de utilizações, entre elas a prova de convergência da série de 
Fourier. 


Desigualdade de Schwarz 


A desigualdade de Schwarz, freqiientemente utilizada, é semelhante à desigualdade de Bessel. Considere a equação 
quadrática com x desconhecido: 


n mn 2 
> (aix + bd)? =Y (2+ E) =0 (10.74) 


com a;, b; reais. Se b;/a; = constante, c, isto é, independente do índice i, então a solução é x = —c. Se b;/a; não 
é uma constante em i, os termos todos não podem desaparecer simultaneamente para x real. Portanto, a solução 
deve ser complexa. Expandindo, constatamos que 


238? ES AE =0, (10.75) 
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e, uma vez que x é complexo (ou = —b;/a;), a fórmula quadrática! para x leva a 


n 2 n n 
[» ot) < > é) [» 8) (10.76) 
1=1 1=1 1=1 


em que sendo que a igualdade vale quando b; /a; é igual a uma constante, independente de i. 
Mais uma vez, em termos de vetores, temos 


(a-b)? = a2b2 cos? 0 < ab”, (10.77) 


0 é o ângulo incluído entre a e b. 
A desigualdade de Schwarz análoga para funções complexas tem a forma 


2 b b 
< / Fa) f(x) de / g" (z)g(2) da, (10.78) 


| / FOR 


sendo que a igualdade vale se, e somente se, g(x) = af(x), sendo œ uma constante. Para provar essa forma 
de função da desigualdade de Schwarz, !4 considere uma função complexa y(x) = f(x) + Ag(x), sendo À uma 
constante complexa, em que f(x) e g(x) são duas funções quadradas integráveis quaisquer (para as quais as 
integrais do lado direito existem). Multiplicando pelo conjugado complexo e integrando, obtemos 


b b b b 
fvd= [ pido+a | Fados f g'f da 
a a E a a 
tax f g*gdz > 0. (10.79) 


O > 0 aparece, uma vez que )“1) é não-negativo, sendo que o sinal de igual (=) vale somente se y(x) for 

identicamente zero. Observando que À e A“ são linearmente independentes, diferenciamos em relação a um deles 
À i kon b 

e igualamos a derivada a zero para minimizar e wap de: 


o |? b b 
> |, wudo= | g'faz+a f gřgdxz = 0. 


Isso resulta em 


b 
“fd 
y= hastis (10.80a) 
f a “gdz 
Considerando o conjugado complexo, obtemos 
b 
*gd 
yts hode (10.80b) 
J, g*gdxæ 


Substituindo esses valores de À e A“ de volta na Equação (10.79), obtemos a Equação (10.78), a desigualdade de 
Schwarz. 

Em Mecânica Quântica, f(x) e g(x) podem, cada uma, representar um estado ou configuração de um sistema 
físico, isto é, uma combinação linear de funções de onda. Então, a desigualdade de Schwarz dá um limite superior 
para o valor absoluto do produto interno f? f“ (x)g(x) dz. Em alguns textos a desigualdade de Schwarz é uma 
etapa fundamental na derivação do princípio da incerteza de Heisenberg. 

A notação de função das Equações (10.78) e (10.79) é relativamente incômoda. Em Física Matemática avançada 
e em especial em Mecânica Quântica é comum usar a notação bra-ket de Dirac. Usando essa notação, nós 
simplesmente entendemos o intervalo de integração, (a,b), e a presença da função de peso w(x) > 0. Nessa 
notação a desigualdade de Schwarz assume a elegante forma 


KFI? < (FIENI). (18a) 


Com discriminante negativo (ou zero). 
Uma derivação alternativa é dada pela desigualdade [JTf(x)g(y) — H(y)g(x)P F(x)g(y) — F(y)g(x)] dz dy > 0. 
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Se g(x) for uma autofunção normalizada, q; (x), a Equação (10.78) resulta em (aqui w(x) = 1) 


b 
TEJ Fa) f(x) de, (10.81) 


um resultado que também se origina da Equação (10.73). 

Para representações úteis da função delta de Dirac em termos de conjuntos ortogonais de funções e da relação 
entre fechamento e completude, referimo-nos à relevante subseção da Seção 1.15, incluindo o Exercício 1.15.16 e, 
para representações em coordenadas versus momento em Mecânica Quântica, referimo-nos à Seção 15.6. 


Resumo — Espaços Vetoriais, Completude 
Aqui resumimos algumas propriedades de espaços vetoriais: em primeiro lugar, considerando os vetores como os 
já conhecidos vetores reais do Capítulo 1, e em seguida, como funções ordinárias. O conceito de completude foi 
desenvolvido para espaços vetoriais finitos (Capítulo 1, Equação (1.5)) e é transportado para espaços vetoriais 
infinitos. Por exemplo, em espaço euclidiano tridimensional todo vetor pode ser escrito em termos de uma 
combinação linear dos três vetores unitários coordenados (representando uma base) envolvendo as componentes 
cartesianas do vetor como os coeficientes de expansão. Ou uma função periódica de um espaço vetorial 
infinito pode ser expandida em termos do conjunto de funções periódicas sen nx, cosnx,n = 0,1,2,..., que 
forma uma base desse espaço. Uma vez que qualquer função periódica com propriedades razoáveis (explicadas 
detalhadamente no Capítulo 14) pode ser expandida em termos dessas funções de seno e co-seno, elas são 
completas e formam uma base de tal espaço de função linear. 

lv. Descreveremos nosso espaço vetorial com um conjunto de n vetores linearmente independentes e;, 


i = 1,2,...,n. Se n = 3, então e1 = X,e» = f, e e3 = Z. Os ne; abrangem o espaço vetorial linear. 
1f. Descreveremos nosso espaço vetorial (funcional) com um conjunto de n funções linearmente independentes, 
p;lx),i = 0,1,...,n — 1. O índice à começa com O para ficar de acordo com a notação clássica de polinômios. 


Aqui, admitimos que y;(x) é um polinômio de grau à. Os ny;(x) abrangem o espaço vetorial (funcional) linear. 
2v. Os vetores em nosso espaço vetorial satisfazem as seguintes relações (Seção 1.2; as componentes do vetor 
são números): 


(a) A adição de vetores é comutativa utv=v+u 
(b) A adição de vetores é associativa u+v+w=u-+[v+w] 
(c) Existe um vetor nulo 0+v=v 
(d) Multiplicação por um escalar 
Distributiva aju + v] = au + av 
Distributiva (a + b)u = au + (b)u 
Associativa albu] = (ab)u 
(e) Multiplicação 
Por escalar unitário lu=u 
Por zero Ou = 0 
(f) Vetor negativo (—1)u = —u. 


2f. As funções em nosso espaço funcional linear satisfazem as propriedades listadas para vetores (substituir 
“função” por “vetor”): 


8 


f(x) + g(x) = g(x) + f(x) 
[H(a) + g(2)] + h(x) = f(e) + [g(x) + h(x)] 
0+ f(x) = f(x) 
a[f(x) + g(x)] = af(x) + ag(a) 
(a +) f(x) = af(a) + bf(a) 
a[bf(x)| = (ab) f(x) 
) 
) 
) 
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3v. Em espaço vetorial n dimensional, um vetor arbitrário c é descrito por suas n componentes (c1,c2,...,Cn), 


“livro” — 2007/8/1 — 15:06 — page 495 — #505 


10. TEORIA DE STURM-LIOUVILLE — FUNÇÕES ORTOGONAIS 495 


ELSEVIER 


ou 
n 


c= 5 Ci€i. 
i=1 
Quando ne; (1) são linearmente independentes e (2) abrangem o espaço vetorial n dimensional, então os e; formam 
uma base e constituem um conjunto completo. 
3f. Em espaço funcional n dimensional um polinômio de grau m < n — 1 é descrito por 


Quando as nọ;(x) (1) são linearmente independentes e (2) abrangem o espaço funcional n dimensional, então as 
p;(x) formam uma base e constituem um conjunto completo (para descrever polinômios de grau m < n — 1). 
4v. Um produto interno (escalar, produto interno) de um espaço vetorial é definido por 


c-d= 5 Cidi. 
i=1 


Se c e d tiverem componentes complexas em um sistema de coordenadas ortogonais, o produto interno é definido 
como a c; d;. O produto interno tem as propriedades de 

(a) Lei distributiva da adição ci(dte)=c-d+c-e 

(b) Multiplicação escalar ciad=ac-d 

(c) Conjugação complexa cid=(d-c)*. 


4f. Um produto interno de um espaço linear de funções é definido por 


b 
(lg) = [ f“ (x)g(x)w(x) dz. 


A escolha da função de peso w(x) e do intervalo (a,b) resulta da equação diferencial satisfeita por p;(x) e das 
condições de fronteira, Seção 10.1. Em terminologia matricial, Seção 3.2, |g) é um vetor coluna e (f| é um vetor 
linha, o adjunto de |f}, onde ambos podem ter infinitamente muitas componentes. Por exemplo, se expandirmos 
g(x) = 35, g;p;(x), então |g) tem a i-ésima componente g; em um vetor coluna e |f} tem f* como sua i-ésima 
componente em um vetor linha. 
O produto interno tem as propriedades listadas para vetores: 

(a) (Flg +h) = (flg) + Fh) 

(b) (Flag) = (fg) 

(e) (Flo) = (gl f)*. 


5v. Ortogonalidade: 
ej: ej = 0, 1 J. 
Se os ne; ainda não forem ortogonais, o processo de Gram-Schmidt pode ser usado para criar um conjunto 


ortogonal. 
5f. Ortogonalidade: 


b 
TE / tee mula) dr=0, dj 


Se as ny;(x) ainda não forem ortogonais, o processo de Gram-Schmidt (Seção 10.3) pode ser usado para criar um 
conjunto ortogonal. 
6v: Definição de norma 


o 1/2 
le] = (c-e)? = ($4) . 
i=1 


Considera-se que os vetores de base e; têm norma (comprimento) unitária e; - e; = 1. As componentes de c são 
dadas por 
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6f. Definição de norma: 


1/2 


= cure =| [ Tor ds "5 E ei | 


Identidade de Parseval. || f|| > 0, a menos que f(x) seja identicamente zero. Pode-se considerar que as funções 
de base y;(x) têm norma unitária (normalização unitária), 


ls = 1. 


Os coeficientes de expansão de nosso polinômio f(x) são dados por 


ci = (pilf), 1=0,1,...,,n—1. 


c:c> ) ci. 
i 


Se o sinal de igual for válido para todo c, ele indica que as e; abrangem o espaço vetorial, isto é, são completas. 
7f. Desigualdade de Bessel: 


7v. Desigualdade de Bessel: 


í 2 
N= [ Irto)Puta)de> S o? 


Se o sinal de igual for válido para toda f, permissível, ele indica que as ;(x:) abrangem o espaço funcional; isto 
é, elas são completas. 
8v. Desigualdade de Schwarz: 
lc - dj < |e]; |d]. 
O sinal de igual é válido quando ce for um múltiplo de d. Se o ângulo incluído entre c e d é 6, então | cos 8| < 1. 
8f. Desiguladade de Schwarz: 


lg < (1) lo)? = IFI- Ig]. 


O sinal de igual é válido quando f(x) e g(x) são linearmente dependentes, isto é, quando f(x) é uma múltipla de 


g(a). 
Agora, deixe n — co, formando um espaço vetorial linear de número infinito de dimensões, 12. 
9v. Em um espaço de número infinito de dimensões nosso vetor c é 


0 
c= ) C;ei;. 
i=1 
Exigimos que 
[0.0] 
2 
) Ci < 00. 
i=1 


As componentes de c são dadas por 


exatamente como em um espaço vetorial de número infinito de dimensões. 

Então, deixe n — oo, formando um espaço vetorial (funcional) linear de número infinito de dimensões, ES, 
Então L representa Lebesgue, o índice 2 para a norma quadrática, isto é, o 2 em |f(x)|2. Nossas funções não 
precisam mais ser polinômios, mas exigimos que f(x) seja no mínimo contínua por partes (condições de Dirichlet 
para série de Fourier) e que (f|f) = f |f (x)| w(x) da exista. Essa última condição costuma ser enunciada como 
um requisito de que f(x) seja integrável de quadrado. 

9f. Sequência de Cauchy (expansão de Fourier generalizada): expanda f(x) = > fipi(a) e deixe 


flo) =. feia). 
1=0 
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Se 
Fæ) - fho >0 n> 


ou 
2 


im | |f@)- J fio) wa) de =0, 


n—>00 


então temos convergência da média o que é análogo ao critério sequência da soma parcial de Cauchy para a 
convergência de uma série infinita, Seção 5.1. 

Se toda sequência de Cauchy de vetores permissíveis (funções contínuas por partes de quadrado, integrável ao 
quadrado) convergir para um vetor limite em nosso espaço linear, diz-se que o espaço é completo. Então, 


fa) = 5 cipila) (em quase todo lugar) 
i=0 


no sentido da convergência da média. Como observamos antes, essa é uma exigência mais fraca do que 
convergência ponto por ponto (valor fixo de x) ou convergência uniforme. 


Coeficientes de Expansão 
Os coeficientes de expansão de uma função f são definidos como 


ci = (y; f} t= ho 


exatamente como em um espaço vetorial de número finito de dimensões. Por conseguinte, 


Fæ) = X (eilfoi(a). 


Um espaço linear (de número finito ou infinito de dimensões) que (1) tenha um produto interno definido ((f|9)) 


e (2) seja completo é um espaço de Hilbert. 

Espaço de Hilbert de número infinito de dimensões fornece uma estrutura natural de trabalho matemático para 
a moderna Mecânica Quântica. Fora da Mecânica Quântica, o espaço de Hilbert conserva sua força e beleza 
matemática abstrata e tem muitas utilizações. 


Exercícios 
10.4.1 Uma função f(x) é expandida em uma série de autofunções ortonormais 


F(s) =D, anna). 
n=0 


Mostre que a expansão de série é única para um dado conjunto de q, (x). Aqui, as funções p, (x) 
estão sendo consideradas vetores de base em um espaço de Hilbert de número infinito de dimensões. 


10.4.2 Uma função f(x) é representada por um conjunto finito de funções de base p;(x), 


N 
Fa) =D apila). 


Mostre que as componentes c; são únicas, que não existe nenhum conjunto diferente c'. 
Nota: Suas funções de base são automaticamente linearmente independentes. Elas não são 
necessariamente ortogonais. 
x 4 : 2 A . —1 é . 
10.4.3 Uma função f(x) é aproximada por uma série de potências >, cia” no intervalo [0, 1]. Mostre 
que minimizar o erro médio quadrático leva a um conjunto de equações lineares 


em que 


498 
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10.4.4 


10.4.5 


10.4.6 


1 
a= x f(x) dz, 1=0,1,2,...,n-1. 
0 


Nota: Os A;; são os elementos da matriz de Hilbert de ordem n. O determinante dessa matriz de 
Hilbert é uma função rapidamente decrescente de n. Para n = 5,detA = 3,7 x 10-12 e o conjunto 
de equações Ac = b está se tornando mal condicionado e instável. 


No lugar da expansão de uma função F(x) dada por 


F(x) = 5 anPn(T), 
n=0 
com r 
RE / Fl) paleyo() de, 


considere a aproximação de série finita 


F(x) x 5 Cnpn (z). 
n=0 


Mostre que o erro médio quadrático 


b 
Í. 
é minimizado considerando c, = an. 

Nota: Os valores dos coeficientes são independentes do número de termos na série finita. Essa 


independência é uma conseqüência da ortogonalidade e não valeria para um ajuste por mínimos 
quadrados usando potências de zx. 


Pelo Exemplo 10.2.2, 


F(a) — y mano w(x) da 


n=0 


h 
> O<a<ga œ 
, 2h sen(2n + 1)x 
Ho=4 ? =" 


—— —T<u<0 n=0 mel 


(a) Mostre que 


i [f(a)]? de = Eh? = aid (2n + 1)7?. 


JAR n=0 


Para um limite superior finito, essa expressão seria a desigualdade de Bessel. Para o limite 
superior oo, ela é a identidade de Parseval. 
(b) Verifique que 
T 4h? & 
=h? = — X (2n+1)? 
> m ) 
n=0 
avaliando a série. 
Sugestão: A série pode ser expressa como a função zeta de Riemann. 


Diferencie a Equação (10.79), 


Col) = (FIF) + AFI) + A gl f) + AM algo, 


com relação a A“ e mostre que você obtém a desigualdade de Schwarz, Equação (10.78). 


ELSEVIER 
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10.4.7 


10.4.8 


10.4.9 


10.4.10 


10.4.11 


Derive a desigualdade de Schwarz pela identidade 


| too as] = T ro do f [g(x)]? dz 
Z A T [H()g(y) — Fly) g(x)]? da dy. 


Se as funções f(x) e g(x) da desigualdade de Schwarz, Equação (10.78), puderem ser expandidas 
em uma série de autofunções o; (x), mostre que a Equação (10.78) se reduz à Equação (10.76) (com 
n possivelmente infinito). 


Observe a descrição de f(x) como um vetor em um espaço funcional no qual y;(x) corresponde ao 
vetor unitário e4. 


O operador H é hermitiano e definido positivo, isto é, para todo f: 


f| Furio 


Prove a desigualdade generalizada de Schwarz: 


b 
p fHgda 


Uma função de onda normalizada y(x) = X o any (x). Os coeficientes de expansão a, são 
conhecidos como amplitudes de probabilidade. Podemos definir uma matriz de densidade p com 
elementos p;; = a;a;. Mostre que 


2 b b 
<[ rafa | g* Hg da. 


(P) = Pij» 
ou 
P =p. 


Por definição, esse resultado faz de p um operador de projeção. 


Sugestão: Use 
foro dy = 1. 


|o:(x))(o:(t) | 


Mostre que 


(a) o operador 


operando sobre 


UORD cslo;(t) 


J 
resulta em 
Ci | Pi (x) . 


(b) DAOA] =1. 


i 
Esse operador é um operador de projeção que projeta f(x) sobre a i-ésima coordenada, 
escolhendo seletivamente a i-ésima componente c;|;(x)) de f(x). 

Sugestão: O operador opera via o produto interno bem definido. 


10.5 Função de Green — Expansão em Autofunção 


Quando expandimos a função de Green nas autofunções da equação homogênea correspondente, resulta uma série 
um tanto similar à que representa (x — t). Na equação não-homogênea de Helmholtz, temos 


V2y(r) + kyr) = —p(r). (10.82) 
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A equação homogênea de Helmholtz é satisfeita por suas autofunções ortonormais Yp, 
Vºpn(r) + kapn(r) = 0. (10.83) 


Como delineado na Seção 9.7, a função de Green G(r, r2) satisfaz a equação de fonte pontual 


V2G(ry,ro) + k°G(rı, r2) = —ô(rı a: r2) (10.84) 


e as condições de contorno impostas às soluções da equação homogênea. Como G é real, expandimos a função de 
Green em uma série de autofunções reais da equação homogênea (10.83), isto é, 


G(r1,r2) Don (r2)pn (r1), (10.85) 


e, substituindo na Equação (10.84), obtemos 


= Sa (r2) kpn (rı) + k? Sa (r2) Pnl rı) --5 Pnl rı Pnl r2). (10.86) 


n=0 n=0 


Aqui ô(rı — r2) foi substituída por sua expansão de autofunção, Equação (1.190). Quando empregamos a 
ortogonalidade de «o, (r1) para isolar an, essa expressão resulta em 


oO 


S am(r2)(k? — k2.) l gm (1) E» Ela) f EE 


m=0 


ou 


an(r2) (k? — ki) = -yn (r2). 


Então, substituindo essa expressão na Equação (10.85), a função de Green se torna 


G(r1, r2) iS Pn aeaeo ' (10.87) 
n=0 


uma expansão bilinear, simétrica em relação a rı e r2, como esperado. Por fim, (rı), a solução desejada da 
equação não-homogênea, é dada por 


phr) = [tri rop(ro dra. (10.88) 


Se generalizarmos nossa equação diferencial não-homogênea para 
L+ AYS =p, (10.89) 


em que £ é um operador hermitiano, constatamos que 


G(r1, r2) sS Pnl iá (10.90) 
n=0 


em que A, é o enésimo autovalor e y, é a autofunção ortonormal correspondente da equação diferencial 
homogênea 
Ly + Ay = 0. (10.91) 


A expansão em autofunções da função de Green na Equação 10.90) torna explícita a propriedade de simetria 
G(r1,r2) = G(ra,r1) e muitas vezes é útil quando se comparam soluções obtidas por outros meios. 


Funções de Green — Unidimensionais 

O desenvolvimento da função de Green para sistemas bi e tridimensionais foi o assunto discutido anteriormente 
neste capítulo e na Seção 9.7. Aqui, por simplicidade, nos restringimos a casos unidimensionais e adotamos uma 
abordagem um pouco diferente. 
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Propriedades Definidas 
Em nossa análise unidimensional consideramos em primeiro lugar a equação não-homogênea 


Ly(x) + f(x) =0, (10.92) 


na qual £ é o operador diferencial auto-adjunto 


d d 
L= I CA + q(x). (10.93) 


Assim como na Seção 10.1, y(x) deve satisfazer certas condições de contorno nas extremidades a e b de nosso 
intervalo [a, b]. 

Agora passamos a definir uma função G um tanto estranha e arbitrária no intervalo |a, b]. Nesse estágio, o 
máximo que se pode dizer em defesa de G é que as propriedades definidoras são legítimas, ou matematicamente 
aceitáveis. Mais adiante, G aparecerá como uma ferramenta razoável para obter soluções da EDO não-homogênea, 
Equação (10.92); esse papel determina suas propriedades. 

1. O intervalo a < x < b é dividido por um parâmetro t. Rotulamos G(x) = Gi(x) paraa < x < te 

G(x) = Go(x) para t < x < b. 

2. Cada uma das funções Gi (x) e G2(x) satisfaz a equação homogênea, ! isto é, 
LGı(x) = 0, a<a<t, 
(10.94) 
LGo(x) = 0, t<r<b. 


3. Ema = a, G(x) satisfaz as condições de contorno que impomos a y(x), uma solução da EDO não-homogênea, 
Equação (10.92). Em xz = b, G2(x) satisfaz as condições de contorno impostas a y(x) nessa extremidade do 
intervalo. Por conveniência as condições de contorno são consideradas homogêneas, isto é, em x = a, 

vla)=0 ou yla)=0 ou ayla)+By(a)=0 
e, do mesmo modo, em x = b. 


4. Exigimos que G(x) seja contínua, !º 


lim Gi(x) = lim Go(a). (10.95) 


voto tt 


5. Exigimos que G” (x) seja descontínua, especificamente que 15 
d d 1 
— Ga(a)|, BR (ol, = “vo: 


da 
em que p(t) vem do operador auto-adjunto, Equação (10.93). Note que, sendo a derivada de primeira ordem 
descontínua, a derivada de segunda ordem não existe. 


(10.96) 


Com efeito, esses requisitos fazem de G uma função de duas variáveis, G(x, t). Além disso, observamos que 
G(x, t) depende da forma do operador diferencial £, bem como das condições de contorno que y(x) deve satisfazer. 
Note que descrevemos as propriedades de funções de Green, para equações diferenciais de segunda ordem. Observe 
que para funções de Green, para equações diferenciais de primeira ordem, as descontinuidades surgem na própria 
G. 

Agora, admitindo que podemos achar uma função G(ax,t) que tenha essas propriedades, nós a denominamos 
função de Green e passamos a mostrar que a solução da Equação (10.92) é 


b 
y(x) = f G(x, t) f(t) dt. (10.97) 


Para fazer isso, em primeiro lugar construímos a função de Green G(x, t). Seja u(x) uma solução da equação 
homogênea que satisfaz as condições de contorno em x = a, e seja v(x) uma solução que satisfaz as condições de 
contorno em x = b. Então, podemos considerar!” 


culs), a<a<t, 
G(z,t) = (10.98) 
cou(x), t<ar<b. 


5Homogênea em relação à função desconhecida. A função f (x) na Equação (10.92) é igualada a zero. 
16Em termos estritos, esse é o limite quando x — t. 
17 As “constantes” cy e c2 são independentes de x, mas podem depender (e dependem) da outra variável, t. 
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Continuidade em x = t (Equação (10.95)) requer 
cout) — cru(t) = 0. (10.99) 
Por fim, a descontinuidade na derivada de primeira ordem (Equação (10.96)) se torna 
1 
J0 


Haverá uma solução única para nossos coeficientes desconhecidos c1 e c2 se o determinante wronskiano 


cav'(t) — ciu (t) = — (10.100) 


não desaparecer. Vimos na Seção 9.6 que o não-desaparecimento desse determinante é uma condição necessária 
para a independência linear. Vamos admitir que u(x) e v(x) sejam independentes. (Se u(x) e v(x) forem 
linearmente dependentes, a situação se torna mais complicada e não é considerada aqui. Veja Courant e Hilbert em 
Leituras Adicionais do Capítulo 9. Para u(x) e v(x) independentes, temos o wronskiano (mais uma vez pela Seção 
9.6 ou pelo Exercício 10.1.4) 

dO Qu) = A. 

p(t) 

no qual À é uma constante. A Equação (10.101) às vezes é denominada fórmula de Abel. Já apareceram numerosos 
exemplos em conexão com as funções de Bessel e Legendre. Agora, pela Equação (10.100), identificamos 


v(t) ut) 
A! ` 
A Equação (10.99) é claramente satisfeita. Substituindo na Equação (10.98), temos como resultado nossa função 
de Green 


(10.101) 


(10.102) 


Cı = 


1 
=q O, a<a<t, 
G(a,t) = i (10.103) 
-que t<x<b. 


Note que G(x,t) = G(t, x). Essa é a propriedade de simetria que foi provada anteriormente na Seção 9.7. Sua 
interpretação física é dada pelo princípio da reciprocidade (via nossa função propagadora) — uma causa em t resulta 
no mesmo efeito em x que uma causa em x produz em t. Em termos de nossa analogia eletrostática, isso é óbvio, 
sendo que a função propagadora depende só da grandeza da distância entre os dois pontos: 


|rı — rol = Ira — Tal. 


Integral da Função de Green — Equação Diferencial 
Construímos G(x, t), mas ainda resta a tarefa de mostrar que a integral na Equação (10.97) com nossa nova função 


de Green é realmente uma solução da equação diferencial original (10.92). Fazemos isso por substituição direta. 
Com G(x, t) dada pela Equação (10.103),!8 a Equação (10.97) se torna 


y(x) = - | “atrai 4 J eE f(t) dt. (10.104) 
Diferenciando, obtemos 
y (x) = a i v'(a)u(t) f(t) dt — ai u(a)v(t) f(t) dt, (10.105) 
sendo canceladas as derivadas dos limites. Uma segunda diferenciação resulta em 
Peo- f reod- f AO 
= ACOM — v(x)u'(x)] f (2). (10.106) 


!8Na primeira integal, a < t < x. Daí G(x, t) = G2(x, t) = —(1/A)u(t)u(x). De modo semelhante, a segunda integral requer G = G1. 
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Pelas Equações (10.100) e (10.102) essa expressão pode ser reescrita como 


A via) e x u” (x) e N F(x) 
y” (x)= E o / (t) f(t) dt o di dl (O) F(t) dt Da): (10.107) 
Agora, substituindo na Equação (10.93), temos 
di b 
Ly(a) = o J u(t) f(t) dt — Cute) / v(t) f(t) dt — fla). (10.108) 


Uma vez que u(x) e v(x) foram escolhidas para satisfazer a equação homogênea, os fatores £ são zero e os termos 
integrais desaparecem, e vemos que a Equação (10.92) é satisfeita. 
Também devemos verificar que y(x) satisfaz as condições de contorno requeridas. No ponto x = a, 


b 

yla) = -10 [ v(t) f(t) dt = cu(a), (10.109) 
a b 

y (a) = e [ v(t) f(t) dt = cu' (a), (10.110) 


uma vez que a integral definida é uma constante. Escolhemos u(x) para satisfazer 
au(a) + Bu'(a) =0. (10.111) 


Multiplicando pela constante c, verificamos que y(x) também satisfaz a Equação (10.111). Isso ilustra a utilidade 
das condições de contorno homogêneas, a normalização não importa. Em problemas de Mecânica Quântica a 
condição de contorno imposta à função de onda costuma ser expressa em termos da razão 


E = - ny(x), comparada a - In ula) a ao. 


Equação (10.111). A vantagem é que a função de onda ainda não precisa ser normalizada. 
Resumindo, temos a Equação (10.97), 


b 
va) = | Clet) dt, 
que satisfaz a equação diferencial (Equação (10.92)), 


Ly(z) + f(x) =0, 


e as condições de contorno, sendo que essas condições de contorno foram embutidas na função de Green, G(x, t). 

Basicamente, o que fizemos foi usar as soluções da equação homogênea, a Equação (10.94), para construir 
uma solução da equação não-homogênea. Mais uma vez, a equação de Poisson é uma ilustração. A solução, 
(Equação (9.148)), representa uma combinação ponderada [p(r2)] de soluções da equação homogênea de Laplace 
correspondente. (Seguimos essas mesmas etapas anteriormente nesta seção.) 

Devemos observar que nossa y(x), Equação (10.97), é, na verdade, a solução particular da equação diferencial, 
Equação (10.92). Nossas condições de contorno excluem a adição de soluções da equação homogênea. Em 
um problema físico real, podemos perfeitamente ter ambos os tipos de soluções. Em eletrostática, por exemplo 
(compare com a Seção 9.7), a solução de função de Green da equação de Poisson dá o potencial criado pela 
distribuição de carga dada. Além disso, pode haver campos externos superpostos. Esses seriam descritos por 
soluções da equação homogênea, equação de Laplace. 


Autofunção, Equação de Autovalor 
A análise precedente não impôs nenhuma restrição especial sobre nossa f(x). Agora, vamos admitir que f(x) = 
Ap(x)y(x).!º Então, temos 


b 
ylz) = af G(x, t)olt)y(t) dt (10.112) 


19A função p(x) é alguma função ponderação, não uma densidade de carga. 
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como uma solução de 
Ly(a) + Ap(a)y(a) = 0 (10.113) 


e e suas condições de contorno. A Equação (10.112) é uma equação integral homogênea de Fredholm de segunda 
espécie e a Equação (10.113) é a equação homogênea de autovalor (com a função de peso w(x) substituída por 
pla). 

Há uma mudança na interpretação de nossa função de Green. Ela começou como uma função propagadora, uma 
função de peso que dá a importância da carga p(r») na produção do potencial «o(r1). A carga p era o termo não- 
homogêneo na equação diferencial não-nomogênea Equação (10.92). Agora, a equação diferencial e a equação 
integral são ambas homogêneas. G(x, t) se tornou um elo que relaciona as duas equações, diferencial e integral. 

Para concluir a discussão dessa equivalência equação diferencial-equação integral, agora vamos mostrar 
que a Equação (10.113) implica a Equação (10.112), isto é, que uma solução de nossa equação diferencial 
(Equação (10.113)) com suas condições de contorno satisfaz a equação integral Equação (10.112). Multiplicamos 
a Equação (10.113) por G(x, t), a função de Green adequada, e integramos de x = a até x = b para obter 


b b 
f G(x, )Lyla) dx + af G(x, t)p(x)y(x)dz = 0. (10.114) 


A primeira integral é subdividida em duas (x < t,x > t), de acordo com a construção de nossa função de Green, 
resultando em 


t b b 
-f G(x, t)Lylx) d- f Gala, t)Ly(a) de= | G(x, Dp(a)y(a) de. (10.115) 


Note que t é o limite superior para as integrais G1 e o limite inferior para as integrais Gs». Vamos reduzir o 
lado esquerdo da Equação (10.115) a y(t). Então, com G(x,t) = G(t, x), temos a Equação (10.112) (com x e t 
permutados). 

Aplicando o teorema de Green ao lado esquerdo ou, o que é equivalente, integrando por partes, obtemos 


- | anfi (refo) tewo] de 
=- eW N S (Zod peed 


t 
-f Gı(x, t)q(x)y(x) dz, (10.116) 


com uma expressão equivalente para a segunda integral. Uma segunda integração por partes resulta em 


t t 
-f Gala, )Ly(a) de = -f y(x)LGı (x,t) dz 
xr=t 
= [Gi (x, t)plæ)y (a) a 
xr=t 
+ [Gi (z, pley] E. (10.117) 
A integral do lado direito desaparece porque LG = 0. Combinando os termos integrados com os resultantes da 
integração de G2, temos 


-oO ee O -OEE Dea — EWO HOED 


+ pa) [antas -vo Gio 


— p(b) [Gato dy (b) — v0) Gle, Jea . (10.118) 


Cada uma das duas últimas expressões desaparece, porque G(x, t) e y(x) satisfazem as mesmas condições de 
contorno. A primeira expressão, com a ajuda das Equações (10.95) e (10.96), se reduz a y(t). Substituindo na 
Equação (10.115), temos a Equação (10.112), concluindo assim a demonstração da equivalência entre a equação 
integral e a equação diferencial mais condições de contorno. 
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Exemplo 10.5.1 OSCILADOR LINEAR 
Como um exemplo simples, considere a equação de oscilador linear (para uma corda vibrante): 


y” (x) + Ay(x) = 0. (10.119) 


Impomos as condições y(0) = y(1) = 0, que correspondem a uma corda presa nas duas extremidades. Agora, para 
construir nossa função de Green, precisamos de soluções da equação homogênea Ly(x) = 0, que é y” (x) = 0. 
Para satisfazer as condições de contorno é preciso que uma das soluções desapareça em x = 0, a outra em x = 1. 
Essas soluções (não-normalizadas) são 


u(x) = z, v(a)=1—4. (10.120) 


Constatamos que 
uv! — vu = —1 (10.121) 


ou, pela Equação (10.101), com p(x) = 1, A = —1. Nossa função de Green se torna 


a(1 — tt), O<uv<t, 
G(x,t) = (10.122) 
t(1-— zx), Eoss 
Daí, pela Equação (10.112) nossa corda vibrante presa nas extremidades satisfaz 
1 
y(z) = af G(x, t)y(t) dt. (10.123) 
0 


Você pode mostrar que as soluções conhecidas da Equação (10.119), 


= EE», 
Y = SEN NTT, ASN TI, 


realmente satisfazem a Equação (10.123). Note que nosso autovalor À não é o comprimento de onda. 


Função de Green e Função Delta de Dirac 
Uma outra abordagem da função de Green pode lançar mais luz sobre nossa formulação e em particular sobre sua 
relação com problemas físicos. Vamos nos referir à equação de Poisson, desta vez, para uma carga pontual: 


V2p(r) = — “pontual, (10.124) 
E0 


A solução de função de Green dessa equação foi desenvolvida na Seção 9.7. Desta vez, vamos considerar uma 
análoga unidimensional 
Ly(x) + f(£)pontuai = 0. (10.125) 


Aqui, f (£)pontual se refere a uma “carga” pontual unitária, ou a uma força pontual. Podemos representá-la de 
várias formas, mas talvez a mais conveniente seja 


= t— t 
TÚ) pontual = 2e' E RR (10.126) 


0, em outra região, 


que é essencialmente a mesma que a Equação (1.172). Então, integrando a Equação (10.125), temos 


t+e t+e 
J Ly(z) da = -f f(£)pontuai dz = —1 (10.127) 
t—e t—e 


pela definição de f(x). Vamos examinar Ly(x) mais de perto. Temos 


t+e t+e 
f “ (eye) de + I qlæ)y(e) de 


—E da t—e 


t+e 
= [p(a)y' (a)|; +f a(e)yla) de = —1. (10.128) 
t 


=E 
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No £ — 0 podemos satisfazer essa relação permitindo que wy'(x) tenha uma descontinuidade de —1/p(x) em 
x = t, sendo que a própria y(x) permanece contínua.” Contudo, essas são apenas as propriedades usadas para 
definir nossa função de Green, G(x, t). Além disso, notamos que no limite € — 0, 


f(x) pontual = o(a T. t), (10.129) 


na qual ô(x — t) é nossa função delta de Dirac, definida dessa maneira na Seção 1.15. Por conseguinte, a 
Equação (10.125) se tornou 
LG(x,t) = —ó(a — t). (10.130) 


Essa é uma versão unidimensional da Equação (9.159), que exploramos para o desenvolvimento das funções de 
Green em duas e três dimensões, Seção 9.7. Vamos lembrar que usamos essa relação na Seção 9.7 para determinar 
nossas funções de Green. 

A Equação (10.130) já era de esperar, visto que, na verdade, é uma consequência de nossa equação diferencial, 
Equação (10.92), e da solução integral da função de Green, Equação (10.97). Se fizermos Ly (índice para destacar 
que ele opera na dependência de x) operar ambos os lados da Equação (10.97), então 


b 
Layla) = Lo f G(æ,t)f (t) dt. 


Pela Equação (10.92) o lado esquerdo é exatamente — f (x). No lado direito, Lz, é independente da variável de 
integração t, portanto podemos escrever 


b 
Ha) = | {260d} HO de 
Pela definição da função delta de Dirac, Equações (1.171b) e (1.183), temos a Equação (10.130). 


Exercícios 
10.5.1 Mostre que 


z, EEA 
G(x,t) = 
t, t<r<l, 


é a função de Green para o operador L = d? /dx? e as condições de contorno 


y(0)=0,  y(1)=0. 


10.5.2 Ache a função de Green para 


a E dyle) R y(0) = 0, 
(a) Ly(x) = de (x), iet 
(b) Ly(a) = cuia) — y(x), y(x) finite para —00 < x < 00. 


10.5.3 Ache a função de Green para os operadores 


@ Lua) = E (22), 


—lnt, 0<zr<t, 
Resposta: G(x, t) = 
—lnga, t<a<l. 


O) Luta) = É (ado 


2 
n . 
dx dx ) E y(x), com y(0) finito e y(1) = 0. 


zE) - e"), O<a<t, 
(E) a en"), t<r<1. 


20 As funções p(x) e q(x) que aparecem no operador £ são funções contínuas. Se y(x) permanecer contínua, f q(x)y(x) dx é certamente 
contínua. Por conseguinte, essa integral sobre um intervalo 2e (Equação (10.128)) desaparece à medida que £ desaparece. 


Resposta: G(x, t) = 


ELSEVIER 
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10.5.4 


10.5.5 


10.5.6 


10.5.7 


10.5.8 


10.5.9 


A combinação de operador e intervalo especificada no Exercício 10.5.3(a) é patológica, no 
sentido de que uma das extremidades do intervalo (zero) é um ponto singular do operador. Como 
conseqüência, a parte integrada (a integral de superfície do teorema de Green) não desaparece. Os 
quatro exercícios seguintes exploram essa situação. 


(a) Mostre que a solução particular de 


é yp(x) = —z. 
(b) Mostre que 


yela) = -24 | GDN, 


em que G(x, t) é a função de Green do Exercício 10.5.3(a). 


Mostre que o teorema de Green, Equação (1.104) em uma dimensão, com um operador do tipo 
Sturm-Liouville (d/dt)p(t)(d/dt) substituindo V - V, pode ser reescrito como 


i l bogo 22) os (ED) a 


b 
= hpa ZE - vop O] 


a 


Usando a forma unidimensional do teorema de Green do Exercício 10.5.5, seja 


= e gott) --ro, 
caen E (nto ER) — JE 


dt ot 


Mostre que o teorema de Green resulta em 


b 
ne) | cento ds [oeno - yo Zeen] 


Para p(t) = t, y(t) = —t, 


ale.) — Int, O<a<t 
vt) = 
—ng, t<ar<l, 


verifique que a parte integrada não se anula. 


Construa a função de Green para 


dy — dy 
2º & KEA k2 2_1 =0 
e Pd x )y ; 


sujeita às condições de contorno 


Dado que 
d? d 
= 2 
L=(1 T Fe o 


G(+1,t) permanece finita, 


mostre que nenhuma função de Green pode ser construída pelas técnicas desta seção (u(x) e v(x) 
são linearmente dependentes). 


508 
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10.5.10 


10.5.11 


10.5.12 


10.5.13 


10.5.14 


10.5.15 


Construa a função de Green unidimensional para a equação de Helmholtz 


As condições de contorno são as de uma onda que avança na direção positiva de x, admitindo uma 
dependência de tempo et, 


Resposta: G(x1, 12) = à explikios — zəl). 


2k 
Construa a função de Green unidimensional para a equação modificada de Helmholtz 


As condições de contorno são que a função de Green deve desaparecer oa £ — œ € 14 — —o. 


Resposta: G (x1, 12) = Lap k|xzı — zəl). 


2k 
Pela expansão em autofunções da função de Green, mostre que 


(a) 


n 


2 5 sen NTESeEnNnTE x(1—t), O<a<t, 
a Hl-2), t<r<1. 


n=1 


Ba (n+ 5 q Rae a T, O<a<t, 
T? (n+5 3)? g t<a<l. 


Nota: Na Seção 10.4 a função de Green de £L + À é expandida em autofunções. Ali, o À é um 
parâmetro ajustável e não um autovalor. 


b 
x) =x G(x, t)p(t) dt 


G(x, t) é uma função de Green dada por 


Na equação de Fredholm, 


Ge) => Palhe 


n=1 
Mostre que a solução é 
Ai — A? 
p(z) = e 3 2 2 RR (o f 10) Ft Jon (t 
n=1 


Mostre que o operador da transformada integral da função de Green 


b 
/ G(z, DI dt 


é igual a — L7! 


(a) La G(x, t)y —y(x), 


, no sentido de que 


b 
©) f Glet) Liyl) di = -yla). 
Nota: Considere Ly(x) + f(x) = 0, Equação (10.92). 


Substitua a Equação (10.87), a expansão em autofunções da função de Green, na Equação (10.88) 
e então mostre que a Equação (10.88) é, de fato, uma solução da equação não-homogênea de 
Helmholtz (Equação (10.82)). 
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10.5.16 (a) Começando com uma equação diferencial não-homogênea unidimensional (Equação (10.89)), 
admita que y(x) e p(x) podem ser representadas por expansões autofunções. Sem qualquer 
utilização da função delta de Dirac ou de suas representações, mostre que 


oo b 
(0) = 3) e de, (a 


Note que (1) se p = 0, não existe nenhuma solução, a menos que À = An e (2) se À = Ay, 
não existe nenhuma solução, a menos que p seja ortogonal a , . Esse mesmo comportamento 
reaparecerá com equações integrais na Seção 16.4. 

Permutando somatório e integração, mostre que você construiu a função de Green 
correspondente à Equação (10.90). 


(b 


ua 


10.5.17 As autofunções da equação de Schrödinger muitas vezes são complexas. Nesse caso a integral de 
ortogonalidade, Equação (10.40), é substituída por 


b 
f eiteestadu(a) do = dg. 


Em vez da Equação (1.189), temos 
ô(rı — r2) -Yon (r1) (r2). 
Mostre que a função de Green, Equação (10.87), se torna 


G(r1,r2) -5 etea Pnl a a 2 = G” (r2, r1). 
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Funções de Bessel 


11.1 Funções de Bessel da Primeira Espécie, J, (x) 


Funções de Bessel aparecem em uma ampla variedade de problemas físicos. Na Seção 9.3, a separação da equação 
de Helmholtz, ou de onda, em coordenadas cilíndricas circulares levou à equação de Bessel. Na Seção 11.7 veremos 
que a equação de Helmholtz em coordenadas polares esféricas também leva a uma forma de equação de Bessel. 
Funções de Bessel também podem aparecer em forma integral — representações integrais. Isso pode resultar de 
transformadas integrais (Capítulo 15) ou da elegância matemática de iniciar o estudo de funções de Bessel com 
funções de Hankel, Seção 11.4. 

Funções de Bessel e funções estreitamente relacionadas a ela formam uma rica área da Análise Matemática 
com muitas representações, muitas propriedades interessantes e úteis e muitas inter-relações. Algumas das mais 
importantes inter-relações são desenvolvidas na Seção 11.1 e seções subseqüentes. Note que as funções de Bessel 
não estão restritas ao Capítulo 11. As formas assintóticas são desenvolvidas na Seção 7.3, bem como na Seção 
11.6. As representações hipergeométricas confluentes aparecem na Seção 13.5. 


Função Geradora para Ordem Inteira 

Embora o interesse primário das funções de Bessel seja como soluções de equações diferenciais, é instrutivo 
e conveniente desenvolvê-las a partir de uma abordagem completamente diferente,! a de função geradora. Essa 
abordagem também tem a vantagem de focalizar as funções em si, em vez das equações diferenciais que elas 
satisfazem. Vamos introduzir uma função de duas variáveis, 


glx, t) = e®/2D 01/9, (11.1) 


Expandindo essa função em uma série de Laurent (Seção 6.5), obtemos 


elt/ DU 1/0) — Se Jalat”. (11.2) 


n=— oo 


É instrutivo comparar a Equação (11.2) com as equivalentes Equações (11.23) e (11.25). 
O coeficiente de t”, Jn (x), é definido para ser uma função de Bessel da primeira espécie de ordem inteira n. 
Expandindo as exponenciais, temos um produto de série de Maclaurin em xt/2 e —x/2t, respectivamente, 


at/2 —au/2t _ o a E ` s[ YU Fios 
E ua ->(5) Ta 1) (5) É (11.3) 
0 


r=0 s= 


Aqui, o índice r do somatório é trocado para n, sendo n = r — s e os limites do somatório n = —s, para 00; a 
ordem dos somatórios é permutada, o que é justificado por convergência absoluta. A faixa do somatório sobre n se 
torna —oo a oo, enquanto o somatório sobre s se estende de máx(—n, 0) a oo. Para um dado s obtemos t”(n > 0) 


porr =n + s: 
n+s n+s S4—s 
T t Tv) t 
1)º : 11.4 
(5) uk ) (5) s! (H 


1 Funções geradoras já foram usadas no Capítulo 5. Na Seção 5.6 a função geradora (1+x)” foi usada para derivar os coeficientes binomiais. 
Na Seção 5.9 a função geradora r(e” — 1)-1 foi usada para derivar os números de Bernoulli. 


510 
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Então, o coeficiente de t” é? 


o0 “Ns n+2s n n+2 
na =Y son (5) a E Rs (11.5) 


= (n+ s)! — 2nn! 2"+2(n + 1) 


Essa forma de série exibe comportamento da função de Bessel J,(x) para x pequeno e permite avaliação 
numérica de J, (1). Os resultados para Jo, Ji e J2 são mostrados na Figura 11.1. Pela Seção 5.3, o erro resultante 
da utilização de apenas um número finito de termos dessa série alternante na avaliação numérica é menor do 
que o primeiro termo omitido. Por exemplo, se quisermos J, (a) com precisão de +1, só o primeiro termo da 
Equação (11.5) já será suficiente, contanto que a razão entre o segundo termo e o primeiro seja menor do que 1 
(em grandeza) ou x < 0,2(n + 1)" 2, As funções de Bessel oscilam, mas não são periódicas — exceto no limite, 
quando x — oo (Seção 11.6). A amplitude de J, (x) não é constante, mas decresce assintoticamente como r712, 
(Veja a Equação (11.137). 


Figura 11.1: Funções de Bessel, Jo(x), Jı (x) e Ja(x). 


Para n < 0, a equação (11.5) resulta em 


Ton) A (11.6) 


s=0 


Uma vez que n é um inteiro (aqui), (s — n)! > oo, para s = 0,...,(n — 1). Por conseguinte, pode-se considerar 
que a série começa com s = n. Substituindo s por s + n, obtemos 


o0 (—1)5+" T n+2s 
Jal) = seii í 11.7 
(2) > sl(s +n)! \2 SED 
que mostra imediatamente que J„ (x) e Jp (x) não são independentes, mas estão relacionadas por 
Jon(a) = (—1)" Tala) (integral n). (11.8) 


Essas expressões de séries (Equações (11.5) e (11.6)) podem ser usadas por n substituído por v para definir J, (x) 
e J.,(x) não-inteiro (compare com o Exercício 11.1.7). 


Relações de Recorrência 

As relações de recorrência para J,(«x) e suas derivadas podem ser todas obtidas por operação sobre a série, 
Equação (11.5), embora isso exija um pouco de clarividência (ou muita tentativa e erro). A verificação das relações 
de recorrência conhecidas é direta (Exercício 11.1.7). Aqui é conveniente obtê-las pela função geradora, g(x, t). 
Diferenciando ambos os lados da Equação (11.1) em relação a t, constatamos que 


1 1 x/2)(t—1/t 
1.0= se(14 5) 2ER) 


= y nao, (11.9) 


n=—00 


| 


z 


2Pelas etapas que levam a essa série e pelas suas características de convergência, deve ficar claro que ela pode ser usada com x substituído 
por z, sendo z qualquer ponto no plano complexo finito. 
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e substituindo a exponencial na Equação (11.2) e igualando os coeficientes de potências iguais de t,? obtemos 


2n 


Jn-1(£) + Jn41 (2) = zro (11.10) 


Essa é uma relação de recorrência de três termos. Dados Jo e J1, por exemplo, Ja (e qualquer outra ordem inteira 
Jn) pode ser calculada. 
Diferenciando a Equação (11.1) em relação a x, temos 


1 1 ES 


n=—00 


Mais uma vez, substituindo na Equação (11.2) e igualando os coeficientes de potências iguais de t, obtemos o 
resultado 
Jn-1(£) — Jn41 (£) = 2J (a). (11.12) 


Como caso especial dessa relação geral de recorrência, 
Jo(a) = -J (x). (11.13) 
Somando as Equações (11.10) e (11.12) e dividindo por 2, temos 


Ja—1(£) = E) + Ji (æ). (11.14) 


Multiplicar por x” e rearranjar os termos produz 


£ rga) = x” Jn- (2). (11.15) 


Subtrair a Equação (11.12) da Equação (11.10) e dividir por 2 resulta em 
Ja(a) = Jale) — Jl (2). (11.16) 


Multiplicando por x” e rearranjando termos, obtemos 


d 
q E Into) = =x" Jn41 (2). (11.17) 


Equação Diferencial de Bessel 

Suponha que consideremos um conjunto de funções Z, (x) que satisfaça as relações básicas de recorrência 
(Equações (11.10) e (11.12)), mas com v necessariamente um inteiro e Z, não necessariamente dada pela série 
(Equação (11.5)). A Equação (11.14) pode ser reescrita (n — v) como 


zZ, (x) = 22,-1(2) — vZ, (£). (11.18) 
Diferenciando em relação a x, temos 
xZ! (x) + (v +1)Zi,— 22) -Z1 =0. (11.19) 
Multiplicando por x e então subtraindo a Equação (11.18) multiplicada por v, temos 
r? Z! ez, — vZ, + (v 1)xZ,1—2ºZ). = 0. (11.20) 
Agora reescrevemos a Equação (11.16) e substituímos n por v — 1: 
Zl = (v — 1)Zr-1 — Zv. (11.21) 


Usando a Equação (11.21) para eliminar Z, 1 e Z/,_; da Equação (11.20), finalmente obtemos 


x£? Z!! + az, + (£? -v2)Z,=0, (11.22) 


3Isso depende do fato de a representação de série de potência ser única (Seções 5.7 e 6.5). 
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que é a EDO de Bessel. Por conseguinte, quaisquer funções Z, (x) que satisfaçam as relações de recorrência 
(Equações (11.10) e (11.12), (11.14) e (11.16) ou (11.15) e (11.17)) satisfazem a equação de Bessel; isto é, as Z, 
desconhecidas são funções de Bessel. Em particular, mostramos que as funções J, (x), definidas por nossa função 
geradora, satisfazem a EDO de Bessel. Se o argumento for kp em vez de x, a Equação (11.22) se torna 


pP’ 
dp? 


Z, (kp) À p ip Zrko) + (k? P? — v’) Zu (kp) = 0. (11.22a) 


Representação Integral 
Um modo particularmente útil e poderoso de tratar funções de Bessel emprega representações integrais. Se 
voltarmos à função geradora (Equação (11.2)) e substituirmos t = e'?, obteremos 


ES - (x) + 2[Jo(x:) cos 26 + Ju(x) cos 40 + --. | 
+ 2i[Ji(x)sen O + Jz(x)sen 30 + ---], (11.23) 


na qual usamos as relações 


Ja)? + Jle)” = Jia) (e — e?) 
= 2iJ(a)seno, (11.24) 
Jive? + Jo(x)e 2? = 2J2(x) cos 20, 


e assim por diante. 
Em notação de somatório, 


cos(asen 0) )+2 2 Jan (x) cos(2n0), 
(11.25) 
sen (zsen 0) = 2 D Jon (x)sen[(2n — 1)0], 
n=1 
igualando as partes real e imaginária da Equação (11.23). 
Empregando as propriedades de ortogonalidade de co-seno e seno,* 
4 T 
/ cos n0 cos m0 do = 3 nm (11.26a) 
0 
/ sen nôsen mf dg = q ôtm, (11.26b) 
0 
nas quais n e m são inteiros positivos (zero excluído)”, obtemos 
1 T 
= i cos(xsen 9) cos n8 do = i Ja), nr (11.27) 
T Jo 0, n ímpar, 
1 [7 0, n par, 
— sen (xsen 0)sen nô do = 7 (11.28) 
T do Jalz), n ímpar. 
Se essas duas equações forem somadas, 
1 T 
Ja(£) = — [cos(asen 6) cos nð + sen (asen 9)sen n0] do 
T Jo 
1 zii 
= f cos(n — zsen 0) do, n = 0,1,2,3,... (11.29) 
T Jo 


4Elas são autofunções de uma equação auto-adjunta (equação do oscilador linear) e satisfazem condições de contorno adequadas (compare 
com as Seções 10.2 e 14.1). 

5As Equações (11.26a) e (11.26b) são válidas para m ou n = 0. Se m e n = 0, a constante em (11.26a) se torna 7; a constante na 
Equação (11.26b) se torna 0. 
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Como caso especial (integre a Equação (11.25) sobre (0, 7) para obter) 


Jo(a) = E T cos(xsen 0) dð. (11.30) 
0 


T 


Observando que cos(xsen 0) repete a si mesmo em todos os quatro quadrantes, podemos escrever a 
Equação (11.30) como 
1 


— 2m 


2T 
Jo(a) J cos(xsen 6) dð. (11.30a) 
0 


Por outro lado, sen («sen 6) inverte o sinal nos terceiro e quarto quadrantes, portanto 
1 27 
> | sen(xsen 0) do = 0. (11.30b) 
27 0 


Somando a Equação (11.30a) e à vezes a Equação (11.30b), obtemos a representação exponencial complexa 


1 


Jo(x) = Bm); 


2m 1 2m 
en dg = — f e7050 do, (11.30c) 
27 Jo 
Essa representação integral (Equação (11.29)) pode ser obtida de um modo um pouco mais direto empregando 
integração de contorno (compare com o Exercício 11.1.16). Existem muitas outras representações integrais 
(compare com o Exercício 11.1.18). 


Exemplo 11.1.1 DIFRAÇÃO DE FRAUNHOFER, ABERTURA CIRCULAR 


Na teoria da difração através de uma abertura circular encontramos a integral 


a 27 
o~ f rar f ettr cos? q (11.31) 
0 0 


para 6, a amplitude da onda difratada.” Aqui, O é um ângulo azimutal no plano da abertura circular de raio a, e a é 
o ângulo definido por um ponto sobre um anteparo abaixo da abertura circular em relação à normal que passa pelo 
ponto central. O parâmetro b é dado por 

2 

b= sen a, (11.32) 

A 
sendo À o comprimento de onda da onda incidente. Os outros símbolos são definidos pela Figura 11.2. Pela 
Equação (11.30c) obtemos? 


Dm 2r | Jo(br)r dr. (11.33) 
0 


A Equação (11.15) nos permite integrar a Equação (11.33) imediatamente para obter 


27ab Aa 2ra 
Po Rê Ji(ab) ~ FA aa (son a). (11.34) 


Note que, aqui, Jı (0) = 0. A intensidade da luz no padrão de difração é proporcional a 62 e 


pn i O R a E (11.35) 


sen Q 


Para n = 0, uma simples integração sobre 0 de 0 a 27 converterá a Equação (11.23) na Equação (11.30c). 

7O expoente ibr cos 0 dá a fase da onda sobre um anteparo distante no ângulo a (r, 0). A forma exponencial imaginária desse integrando 
significa que a integral é tecnicamente uma transformada de Fourier (Capítulo 15). Em geral, o padrão da difração de Fraunhofer é dado pela 
transformada de Fourier da abertura. 

$Também poderíamos nos referir ao Exercício 11.1.16(b). 
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| l | | | | Ondas incidentes 


>x 


Figura 11.2: Difração de Fraunhofer, abertura circular. 


Tabela 11.1 Zeros das funções de Bessel e suas derivadas de primeira ordem 
Número de zeros Jo(x) J(a) Jo(a) J3(x) Ja(a) J5(x) 
1 2,4048 3,8317 5,1356 6,3802 7,5883 8,7715 
2 5,5201 7,0156 8,4172 9,7610 11,0647 12,3386 
3 8,6537 10,1735 11,6198 13,0152 14,3725 15,7002 
4 
5 


11,7915 13,3237 14,7960 16,2235 17,6160 18,9801 
14,9309 16,4706 17,9598 19,4094 20,8269 22,2178 
RA JO Jo) Jo 

1 3,8317 1,8412 3,0542 4,2012 

2 7,0156 5,3314 6,7061 8,0152 

3 10,1735 8,5363 9,9695 11,3459 


Jó(a) = -Jı (x). 


Pela Tabela 11.1, que relaciona os zeros das funções de Bessel e suas derivadas de primeira ordem,’ a 
Equação (11.35) terá um zero em 


2 
“sen a =3,8817..., (11.36) 
ou 
sena = DAUN (11.37) 
2ra 


Para luz verde, A = 5,5 x 1075 cm. Daí, se a = 0,5 cm, 
a ~ sen a = 6,7 x 107º (radianos) ~ 14 segundos de crc, (11.38) 


o que mostra que a curvatura ou amplitude do raio de luz é extremamente pequena. Se essa análise fosse conhecida 
no século XVII, os argumentos contra a teoria de onda da luz teriam caído por terra. Em meados do século XX, 
esse mesmo padrão de difração apareceu na dispersão de partículas nucleares por núcleos atômicos — uma notável 
demonstração das propriedades de onda das partículas nucleares. E 


Um outro exemplo da utilização de funções de Bessel e suas raízes é dado pela cavidade ressonante 
eletromagnética (Exemplo 11.1.2) e pelos exemplo e exercícios da Seção 11.2. 


Raízes adicionais das funções de Bessel e suas derivadas de primeira ordem podem ser encontradas em C. L. Beattie, Table of first 700 
zeros of Bessel Functions. Bell Syst. Tech. J. 37: 689 (1958), e Bell Monogr. 3055. Raízes podem ser acessadas no software Mathematica e 
outros softwares simbólicos que estão na Web. 
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Exemplo 11.1.2 CAVIDADE RESSONANTE CILÍNDRICA 
A propagação de ondas eletromagnéticas em cilindros metálicos ocos é importante em muitos dispositivos 
práticos. Se as extremidades do cilindro forem superfícies, ele é denominado cavidade. Cavidades ressonantes 
desempenham um papel crucial em muitos aceleradores de partículas. 

Considerando o eixo z ao longo do centro da cavidade cujas extremidades são superfícies em z = 0e z = le 
usamos coordenadas cilíndricas sugeridas pela geometria. Suas paredes são condutores perfeitos, portanto o campo 
elétrico tangencial desaparece nelas (como na Figura 11.3): 


x 


Figura 11.3: Cavidade ressonante cilíndrica. 


E, =0 = Eọ, para p = a, E, =0= E, para z = 0,1l. 


Dentro da cavidade temos um vácuo, portanto coo = 1/c?. Ondas magnéticas no interior de uma cavidade 
ressonante oscilam com dependência harmônica do tempo e '“*, o que resulta de separar o tempo das variáveis 
espaciais em equações de Maxwell (Seção 1.9), portanto 


Com V - E = 0 (vácuo, nenhuma carga) e a Equação (1.85), obtemos, para a parte espacial do campo elétrico, 


1 E 9 w 


V’°E+0E-=0, 


que é denominada EDP vetorial de Helmholtz. A componente z (E, somente parte espacial) satisfaz a equação 
escalar de Helmholtz, 
VºE, +@?E, = 0. (11.39) 


As componentes do campo elétrico transversal E, = (Ep, Ep) obedecem à mesma EDP, mas em condições de 
contorno diferentes, dadas anteriormente. Uma vez que E, é conhecida, as equações de Maxwell determinam E, 
totalmente. Se o leitor quiser detalhes, consulte Jackson, Electrodynamics, nas Leituras Adicionais. 


E a ż g : E. x 
Separamos a variável z de p e p, porque não há nenhuma derivada mista 5z o, etc. A solução de produto, 


E, = v(p, pJw(z), é substituída na EDP de Helmholtz por E, usando a Equação (2.35) para V? em coordenadas 
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cilíndricas, e então dividimos por vw, resultando 


1 w (5 10v 1 02u 


2 o 
w(z) dz? vidp? F pp lá P dp? Te Jeo. 2) = 


Isso implica 


1 Pw 1 dv 1ôv 10% 

w(z) de?  vlpp)Ãdp? pp Pog? 
Aqui, k? é uma constante de separação porque os lados direito e esquerdo dependem de variáveis diferentes. 
Para w(z) encontramos a EDO do oscilador harmônico com solução de onda estacionária (não-transitória) que 
procuramos, 


+ oo) = k. 


w(z) = Asen kz + B cos kz, 
com 4, B constantes. Para v(p, 7) obtemos 


dv 10 E 1 02v 
dp? pop pP op? 


+yv=0, p= =. 


2y 


dp” 


Nessa EDO podemos separar as variáveis p e p porque não há nenhum termo misto » 
v = u(p)® (p) em 


A forma de produto 


p2 (= 1 du A 1 dö 3 


22[——>—— — =>Wm , 
u(p) \d? pdp (yp) dp? 


em que a constante de separação m? deve ser um inteiro, porque a solução angular & = e#™”? da EDO 


deve ser periódica no ângulo azimutal. 
Isso nos deixa com a EDO radial 


du e 1 du no po m? 0 

— + -— — — jJu=0. 
do? pd V P 

Argumentos dimensionais sugerem elevar p — r = yp e dividir por yº, o que resulta em 


2 2 
iaai m Ju=o. 


dr? rdr r2 


Essa é a EDO de Bessel para v = m. Usamos a solução regular Jm(yp) porque a segunda solução independente 
(irregular) é singular na origem, o que é inaceitável aqui. A solução completa é 


E, = Jm(yp)e"™? (Asen kz + B cos kz), (11.40a) 


em que a constante y é determinada pela condição de contorno E, = 0 sobre a superfície da cavidade p = a, 
isto é, que ya seja uma raiz da função de Bessel Jm (veja a Tabela 11.1). Isso dá um conjunto discreto de valores 
Y = Ymn €M que n designa a enésima raiz de Jm (veja a Tabela 11.1). 

Para o modo de oscilação transversal magnético, ou TM, com H, = 0, as equações de Maxwell estão implícitas. 
(Mais uma vez, consulte Resonant Cavities em Electrodynamics de J. D. Jackson, em Leituras Adicionais.) 


ðE, 910 
E = Epi SA, 
Nia wa a 


A forma desse resultado sugere E, ~ cos kz, isto é, estabelecer 4 = 0, de modo que E, ~ sen kz = 0 em 
z = 0, l possa ser satisfeita por 


k= É p=0,1,2,... (11.41) 
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Assim, os campos elétricos tangenciais Æ, e E, desaparecem em z = 0 e l. Em outras palavras, 4 = 0 
corresponde às dE. /dz = 0 em z = 0 e z = l para o modo TM. Então, no total, temos 


P= - k? = E E (11.42) 
com 
Y= Yan = E, (11.43) 
a 
em que amn é O enésimo zero de Jm. Agora, a solução geral 
E, =D IV mn) EP Bmnpcos e (11.40b) 


m,n,p 


com constantes Bmnp, resulta do princípio da superposição. 
O resultado das duas condições de contorno e da constante de separação m? é que a freqüência angular de nossa 
oscilação depende de três parâmetros discretos: 


2 272 m=0,1,2,..., 
dam | PPT? i E a (11.44) 
1,2. 


WUmnp = € 
p a2 IP) 


Essas são as frequências ressonantes permissíveis para nosso modo TM. O modo TE (transversal elétrico) de 
oscilação é o tópico do Exercício 11.1.26. E 


Abordagens Alternativas 

As funções de Bessel são introduzidas aqui por meio de uma função geradora, Equação (11.2). Há outras 

abordagens possíveis. Uma listagem das várias possibilidades apresenta: 

1. Função geradora (mágica), Equação (11.2). 

2. Solução de série de equação diferencial de Bessel, Seção 9.5. 

3. Integrais de contorno: alguns autores preferem começar com definições de integral de contorno das funções de 
Hankel, Seções 7.3 e 11.4, e desenvolver a função de Bessel J, (x) a partir das funções de Hankel. 

4. Solução direta de problemas físicos: o Exemplo 11.1.1, difração de Fraunhofer com uma abertura circular 
ilustra isso. A propósito, a Equação (11.31) pode ser tratada por expansão de série, se quisermos. Feynman! 
desenvolve funções de Bessel a partir de uma consideração de ressonante de cavidade. 


Caso a função geradora pareça muito arbitrária, ela pode ser derivada de uma integral de contorno (Exercício 
11.1.16) ou das relações de recorrência da função de Bessel (Exercício 11.1.6). Note que a integral de contorno 
não é limitada ao inteiro v, o que nos dá um ponto de partida para desenvolver as funções de Bessel. 


Funções de Bessel de Ordem Não-Inteira 


Essas diferentes abordagens não são exatamente equivalentes. A abordagem da função geradora é muito 
conveniente para derivar duas relações de recorrência, equação diferencial de Bessel, representações integrais, 
teoremas da adição (Exercício 11.1.2) e limites superiores e inferiores (Exercício 11.1.1). Contudo, é provável que 
você já tenha notado que a função geradora definiu apenas funções de Bessel de ordem inteira, Jo, J1, J2, e assim 
por diante. Essa é uma limitação da abordagem da função geradora que pode ser evitada usando, em vez dela, 
a integral de contorno do Exercício 11.1.16, o que leva à abordagem precedente (3). Mas a função de Bessel da 
primeira espécie, J, (x), pode facilmente ser definida para v não-inteiro usando a série (Equação (11.5)) como uma 
nova definição. 

As relações de recorrência podem ser verificadas por substituição na forma de série de J, (a) (Exercício 11.1.7). 
A equação de Bessel resulta dessas relações. De fato, se v não for um inteiro, na verdade há uma importante 
simplificação. Constata-se que Jy e J.., são independentes, porque não existe nenhuma relação da forma da 
Equação (11.8). Por outro lado, para v = n, inteiro, precisamos de uma outra solução. O desenvolvimento dessa 
segunda solução e uma investigação de suas propriedades são o assunto da Seção 11.3. 


IOR, P, Feynman, R. B. Leighton, e M. Sands, The Feynman Lectures on Physics, vol. II. Reading, MA: Addison-Wesley (1964), Chapter 23. 
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Exercícios 


11.1.1 


11.1.2 


11.1.3 


11.1.4 


11.1.5 


11.1.6 


Pelo produto das funções geradoras g(x, t) - g(x, —t), mostre que 
2 2 2 
1 = [Jo(a)] + 2[7 (æ) + 2[J (2) +- 


e, portanto, que |Jo(£)| < 1 e |a (x)| < 1/V2,n = 1,2,3,... 
Sugestão: Use unicidade de séries de potências, Seção 5.7. 


Usando uma função geradora g(x, t) = g(u + v, t) = g(u, t) - g(v,t), mostre que 


@) luto) = 5 J(u): Jn-s(v), 


s=— 00 


(b) Jo(u +v) = Jo(u (+23 a 


Esses são teoremas da adição para as PR de Bessel. 


Usando somente a função geradora 


elS/D=1/0) — F A 


n=— oo 


e não a forma explícita de série de J, (x), mostre que Jn(x) tem paridade ímpar ou par conforme n 
for ímpar ou par, isto é,!! 


Derive a expansão de Jacobi-Anger 
et” cos _ >; i” Jm (ene, 
m=— oo 


Essa é uma expansão de uma onda plana em uma série de ondas cilíndricas. 


Mostre que 


(a) cosx = Jo(£)+ 2 Ha 3" Jona 


(b) sen x = 2 Ha )” Jəan41 (o): 


Para ajudar a tirar a função geradora do reino da magia, mostre que ela pode ser derivada da relação 
de recorrência, Equação (11.10). 
Sugestão: 


(a) Admita uma função geradora da forma 
5 Jm(a)t 


(b) Multiplique a Equação (11.10) por t” e some sobre n. 
(c) Reescreva o resultado anterior como 


1 _ 2t ðg(x,t) 


(d) Integre e ajusta a “constante” de integração (uma função de x), de modo que o coeficiente da 
potência de ordem zero, tº, é Jo(x), como fornecido pela Equação (11.5). 


Hsso é visto com facilidade pela forma de série da Equação (11.5). 


520 
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11.1.7 


11.1.8 


11.1.9 


11.1.10 


11.1.11 


11.1.12 


11.1.13 


Mostre, por diferenciação direta, que 


satisfaz as duas relações de recorrência 


Jy-a(a) + Joyala) = zre) 
Jo-a(a) — J41 (£) = 2J, (0), 


e a equação diferencial de Bessel 
2º Ji (x) + aJ; (x) + (£? — v?) Jo (£) = 0. 
Prove que 


sen £ 1 — cosa 


n/2 n/2 
= / Jo(a cos 0) cos 0 do, = I Jı(x cos 0) do. 
0 0 


ğ 
Sugestão: A integral definida 


2.4-6- (Ds) 
1-3-5- (25+ 1) 


n/2 
À costs+1 9 dg = 
0 


pode ser útil. 
Mostre que 


2 fl cosat 
Jo) == [ ii 


Essa integral é uma transformada de Fourier de co-seno (compare com a Seção 15.3). A 
correspondente transformada de Fourier de seno, 


2 [OS senat 
Jo(x) = GE ai 


é estabelecida na Seção 11.4 (Exercício 11.4.6) usando uma representação integral de função de 
Hankel. 


Derive 


POR ANO A 
Inla) = (—1)ax” | =— ) Jo(a). 
x dx 
Sugestão: Tente indução matemática. 
Mostre que, entre quaisquer dois zeros consecutivos de J„(x), há um, e somente um, zero de 


Jasi(a). 
Sugestão: As Equações (11.15) e (11.17) podem ser úteis. 


Uma análise de padrões de radiação de antena para um sistema com uma abertura circular envolve 
a equação 


g(u) = I f(r) Jolur)r dr. 
Se f(r) = 1 — r2, mostre que , 
o(a) = 2 do(u) 


A seção de choque diferencial em um experimento de espalhamento nuclear é dada por do /dQ = 
|f(0)|2 . Um tratamento aproximado leva a 

—ik 27 R 

FO = -— / / exp[ikpsen 9sen p]p dp dy. 

27 Jo Jo 

Aqui, 0 é um ângulo pelo qual a partícula dispersa é espalhada. R é o raio nuclear. Mostre que 


do a 1[ J(kRsen 0) 3 
d (aR H| sen 0 l 
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11.1.14 Um conjunto de funções C, (x) satisfaz as relações de recorrência 


Cn-i(a) 


o Gr F 
Ca 1(x) + Cn+1(2) = 2C} (£). 


(a) Que EDO linear de segunda ordem C, (x) satisfaz? 
(b) Transforme sua EDO em equação de Bessel por uma troca de variável. Isso sugere que Cn (x) 
pode ser expressa em termos de funções de Bessel de argumento transformado. 


11.1.15 Uma partícula (massa m) está contida em um cilindro circular reto (uma pastilha) de raio R e altura 
H. A partícula é descrita por uma função de onda que satisfaz a equação de onda de Schrödinger 


DE sô a 
To PCP, 9,2) Ey(p, p, z) 


e a condição que a função de onda vá a zero sobre a superfície do cilindro. Ache a energia mais 
baixa (ponto zero) permitida. 
R? zN” na? 
R ta: E = — || 2 Si 
esposta z(a) (7) l 


p - Rê [(2405 s (7 ? 
mn 2m|\ R Hj | 
em que 2pq é O q-ésimo zero de q e o índice Jp e o índice p fixado pela dependência azimutal. 


11.1.16 (a) Mostre por diferenciação direta e substituição que 


140) =D f ue gy 
” 271 C 


ou que a equação equivalente, 


1 V 
J (x) = E (5) TE ER ds, 


satisfaz a equação de Bessel. C é o contorno mostrado na Figura 11.4. O eixo real negativo é a 
linha de corte. 

Sugestão: Mostre que o integrando total (após substituição na equação diferencial de Bessel) 
pode ser escrito como uma derivada total: 


RYO) 


RA 


Figura 11.4: Contorno da função de Bessel. 
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11.1.17 


11.1.18 


11.1.19 


11.1.20 


(b) Mostre que a primeira integral (sendo n um inteiro) pode ser transformada em 


1 2 


Jax) = 27 E 


T n 27 
e'(xsen 9—n0) do = too / et cos 0+n0) do. 
27 0 


—in 


O contorno C no Exercício 11.1.16 é deformado para o caminho —oo a —1, círculo unitário e™*" a 
e” e, por fim, —1 a —oo. Mostre que 


1 /7 oo 
Ju(x) = zf cos(v0 — zsen 0) do — “mr [ e—"9-=senh o do. 
9 0 


T T 


Essa é a integral de Bessel. 
Sugestão: Os valores negativos da variável de integração u podem ser manipulados usando 


u = te™. 


(a) Mostre que 
2 rN” [7P o 
Jy(a)=—>>——= | 5 cos(asen 0) cos*” 0 do, 
0 


mi/2(v — 4)! \2 


em que v > -4. 
Sugestão: Eis aqui uma chance de usar expansão de série e integração termo a termo. As 
fórmulas da Seção 8.4 mostrarão ser úteis. 

(b) Transforme a integral da parte (a) em 


1 sN” f 7 
140) = anla) J cos(x cos 0)sen?”6 do 


giz cos sen?” 6 do 


8 

Na A 
x 
ER 


1 
o ni/2(v — 5)! G 


1 s” f ; 
SSN A tipz(] — 2 v—1/2 q f 
me) fe ( p“) p 


Essas são representações integrais alternativas de J, (x). 


(a) Por 
1 T ” 2 
J, PEE [9 tolet /4t dt 
(a) sm (5) f é 


(b) Por 
bee gg | ate di 


2ri 
derive a relação de recorrência 
Jia) = 4 [u-l) - (2). 
Mostre que a relação de recorrência 


Jal) = 3 [In-1(2) — Jat (E)] 


resulta diretamente da diferenciação de 


1 T 
Jna(£)=— | cos(n — xsen 0) do. 
T Jo 


ELSEVIER 
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11.1.21 


11.1.22 


11.1.23 


11.1.24 


11.1.25 


11.1.26 


Avalie Em 
f e`" Jo(bx) dz, a,b > 0. 
0 


Na verdade, os resultados são válidos para a > 0,-00 < b < oo. Essa é uma transformada de 
Laplace de Jo. 
Sugestão: Uma representação integral de Jo ou uma expansão de série será útil. 


Usando formas trigonométricas, verifique que 


1 


27 
Jo(br) = z- f end 


(a) Plote a intensidade (62 da Equação (11.35)) como uma função de (sen a/A) ao longo de um 
diâmetro do padrão de difração circular. Localize os dois primeiros mínimos. 

(b) Que fração da intensidade total da luz cai dentro do máximo central? 

Sugestão: [Jı (x)]?/x pode ser escrita como uma derivada, e a integral de área da intensidade pode 

ser integrada por inspeção. 

A fração da luz incidente sobre uma abertura circular (incidência normal) que é transmitida é dada 

por 


2ka 2ka 
dx 1 
=, — — — ; 
f Jo(a) z A Ja(x) dx 


Aqui, a é o raio da abertura e k é o número de onda, 27 /A. Mostre que 


1 2ka 


1 (0,6) 
(a) ed, den Dao : Jo(a) dz. 


A amplitude U (p, p, t) de uma membrana circular vibratória de raio a satisfaz a equação de onda 


Aqui, v é a velocidade de fase da onda fixada pelas constantes elásticas e por qualquer atenuação 
que seja imposta. 


(a) Mostre que a solução é 
U (p, P, t) = Jmlkp) (aje? + aze?) (biet + baet) E 


(b) Pela condição de contorno de Dirichlet, Jm(ka) = 0, ache os valores permissíveis do 
comprimento de onda A(k = 27/)). 


Nota: Há outras funções de Bessel além de Jm, mas todas elas divergem em p = 0. Há uma 
demonstração explícita disso na Seção 11.3. Na verdade, o comportamento divergente está implícito 
na Equação (11.6). 
O Exemplo 11.1.2 descreve os modos TM de oscilação de cavidade eletromagnética. Os modos 
transversais elétricos (TE) são diferentes, no sentido de que trabalhamos a partir da componente z 
da indução magnética B: 

VºB.+0ºB,=0 


com condições de contorno 


oB, 
B.(0) = Bi(l) = 0 e = 0. 
dp Sh 
Mostre que as frequências ressonantes TE são dadas por 
2 2 
Wmnp = € fmn PT DE A pese 
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11.1.27 Esboce um gráfico das três frequências ressonantes angulares TM mais baixas e as três frequências 
ressonantes angulares TE mais baixas, wmnp, como uma função da razão raio/comprimento (a/1) 
para 0 < a/l < 1.5. 
Sugestão: Tente traçar w? (em unidades de c? /a?) contra (a/1)?. Qual é a causa dessa escolha? 


11.1.28 Um disco condutor delgado de raio a está carregado com uma carga q. Mostre que o potencial é 
descrito por 


bad e -klel (k sen ka yz, 
(1,2) = gf ne dk 


em que Jo é a função de Bessel usual e r e z são as familiares coordenadas cilíndricas. 

Nota: Esse problema é difícil. Uma abordagem é por meio de transformadas de Fourier como 
no Exercício 15.3.11. Para uma discussão do problema físico, consulte Jackson (Classical 
Electrodynamics, em Leituras Adicionais). 


11.1.29 Mostre que 


(a) é integrável em termos da funções de Bessel e potências de x (tal como a? J;(a)) para m + n 
ímpar; 
(b) pode ser reduzida a termos integrados mais f a Jo(a)da para m + n par. 
11.1.30 Mostre que 


gn y 1 gn 
f (1 — 2) Jo(y)y dy = — Jo(y) dy. 
0 Qo 


n Agn Jo 


Aqui, &on é a enésima raiz de Jo(wy). Essa relação é útil (veja o Exercício 11.2.11): a expressão da 
direita é mais fácil e mais rápida de avaliar — e muito mais exata. Considerar a diferença entre os 
dois termos na expressão da esquerda nos leva a um erro relativo grande. 


11.1.31 A amplitude de difração da abertura circular & da Equação (17.35) é proporcional a f(z) = 

Jı(z)/z. A correspondente amplitude de difração da abertura única é proporcional a g(z) = 

sen z/2. 

(a) Calcule e trace f(z) e g(z) para z = 0,0(0,2)12,0. 

(b) Localize os dois valores mais baixos de z(z > 0) para os quais f(z) assume um valor extremo. 
Calcule os valores correspondentes de f(z). 

(c) Localize os dois valores mais baixos de z(z > 0) para os quais g(z) assume um valor extremo. 
Calcule os valores correspondentes de g(z). 


11.1.32 Calcule o potencial eletrostático de um disco carregado «(r,z) a partir da forma integral do 
Exercício 11.1.28. Calcule o potencial para 7 /a = 0,0(0,5)2,0 e z/a = 0,25(0,25)1, 25. Porque 
z/a = 0 é omitido? O Exercício 12.3.17 é uma versão harmônica esférica desse mesmo problema. 


11.2 Ortogonalidade 


Se a equação de Bessel, Equação (11.22a), for dividida por p, vemos que ela se torna auto-adjunta e, portanto, pela 
teoria de Sturm-Liouville, Seção 10.2, espera-se que as soluções sejam ortogonais — se pudermos providenciar que 
as condições de contorno adequadas sejam satisfeitas. Para cuidar das condições de contorno para um intervalo 
finito [0, a], introduzimos parâmetros a e &ym no argumento de J, para obter J,(a,mp/a). Aqui, a é o limite 
superior da coordenada radial cilíndrica p. Pela Equação (11.224), 


d2 d 2 2 
pato (mt) +o” (mt) a (cimo - ji (mt) =0. (11.45) 


Mudando o parâmetro aym para an, constatamos que Jy (&ynp/a) satisfaz 


d? d 2 2 
pato (cm) koi (om2) | (exe? 4 )s (a£) =0. (11.45a) 
p a p a a p a 
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Precedendo como na Seção 10.2, multiplicamos a Equação (11.45) por J,(a,np/a) e a Equação (11.45a) por 
Ju (&vmp/a) e subtraímos, obtendo 


pyd| d p pyd| d p 
dy (ant) [od (mt) dg (mt) [od un 


2.0.3 
st ii, (om2) Äi (ant), (11.46) 
a a 


a 


Integrando de p = 0 a p = a, obtemos 
f p\d| d p i pyd[ d p 
Jy vno | g. J, vm d E Jy vm E —dJy vn d 
/ (a dE (a al ú | (a dea Menar 


2 2 a 
= Sn o eim f (cum) doom )pdo (11.47) 
a 0 a a 


Integrando por partes, vemos que o lado esquerdo da Equação (11.47) se torna 


d a 
ps, (mt) — dy (om2) Pe ps, (aomt) ras (an2) 
aj dp aj |o aj dp a 


Para v > 0 o fator p garante um zero no limite mais baixo, p = O. Na verdade, o limite mais baixo sobre o 
índice v pode ser estendido até v > —1, Exercício 11.2.4.!"? Em p = a, cada expressão se anula se escolhermos 
que os parâmetros a,n € Gym Sejam zeros ou raízes de J,, isto é, J (aym) = 0. Agora, os índices se tornam 
significativos: am é 0 m-ésimo zero de J,. 

Com essa escolha de parâmetros, o lado esquerdo desaparece (as condições de fronteira de Sturm-Liouville são 


satisfeitas) e, para m Æ n, 
/ GÊ (mt) J, (mt )pdo= 0. (11.49) 
0 a a 


Isso nos dá ortogonalidade no intervalo [0, a]. 


a 


(11.48) 


0 


Normalização 


A integral de normalização pode ser desenvolvida voltando à Equação (11.48), fazendo an = Am + E, 
e considerando o limite € — 0 (compare com o Exercício 11.2.2). Com a ajuda da relação de recorrência, 
Equação (11.16), o resultado pode ser escrito como 


a 2 2 
/ |» (am) pdp = Č ERRO (11.50) 
0 a 2 


Séries de Bessel 


Se admitirmos que o conjunto de funções de Bessel J,(a,mp/a))(v fixado, m = 1,2,3,...) é completo, então 
qualquer função bem-comportada, mas, sob qualquer outro aspecto, arbitrária, f(p), pode ser expandida em uma 
série de Bessel (Bessel-Fourier ou Fourier-Bessel) 


N= Ð emd (com). 0<p<a, v>-1. (11.51) 
m=1 q 


Os coeficientes Cym são determinados usando a Equação (11.50) 


- 2 É p 
cm = aaan h, Ohea) RA 


Uma expansão de série similar envolvendo J, (8„mp/a) com (d/do)I(B,mP/0)|p=a = O é incluída nos 
Exercícios 11.2.3 e 11.2.6(b). 


120 caso v = —1 reverte para v = +1, Equação (11.8). 
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Exemplo 11.2.1 POTENCIAL ELETROSTÁTICO EM UM CILINDRO OCO 


Pela Tabela 9.3 da Seção 9.3 (com a substituído por k), nossa solução da equação de Laplace em coordenadas 
cilíndricas circulares é uma combinação linear de 


Vm(P: 69,2) = Jm(kp)[amsen my + bm cos mg] [cie + cge™7]. (11.53) 


A combinação linear particular é determinada pelas condições que devem ser satisfeitas. Aqui, nosso cilindro tem 
um raio a e uma altura l. A seção da extremidade superior tem uma distribuição de potencial 1)(p, p). Em todos os 
outros lugares sobre a superfície o potencial é zero.!? O problema é achar o potencial eletrostático 


Plo, p, z 59 tl (p; 9,2 (11.54) 


em todos os lugares no interior. 

Por conveniência, as coordenadas cilíndricas circulares são posicionadas como mostra a Figura 11.3. Visto que 
w(p, 7,0) = 0, consideramos cı = —c2 = >. A em z se torna dependência senh kz, que se anula em z = 0. A 
exigência de que 1) = 0 sobre as laterais cilíndricas é cumprida exigindo que a constante de separação k seja 


k= ae (11.55) 


a 


onde o primeiro índice, m, dá o índice da função de Bessel, enquanto o segundo índice identifica o zero particular 
de Jm. 
O potencial eletrostático se torna 


son= E Šonom) 


m=0n=1 


- [amnsen my + bmn Cosme] - senh (om) $ (11.56) 
a 


A Equação (11.56) é uma série dupla: uma série de Bessel em p e uma série de Fourier em g. 
Em z = 1,4) = b(p, p), uma função conhecida de p e ọ. Portanto, 


- EB 


m=0 n=l 


l 
- [amnsen my + bmn cos my] - senh (mn 2) (11.57) 
a 


As constantes amn € bmn são avaliadas usando as Equações (11.49) e (11.50) e as equações correspondentes para 
sen Y e cos y (Exemplo 10.2.1 e Equações (14.2), (14.3), (14.15) a (14.17)). Encontramos!4 


l = 
amn } = 2 jrasenh (com ifam) 
a 


bmn 
am pa P sen My 
a j j lp, O) Im (como e) i cos my hodo do. (11.58) 
0 0 


Essas integrais são definidas, isto é, são números. Substituindo de volta na Equação (11.56), a série é especificada 
e o potencial )(p, Y, 2) é determinado. E 


Forma do Contínuo 


A série de Bessel, Equação (11.51) e o Exercício 11.2.6 se aplicam a expansões no intervalo finito [0, a]. Se 
a — œ, então podemos esperar que as formas de série passem para integrais. As raízes discretas &ym Se tornam 


13Se % = 0, em z = 0, l, masi) Æ 0, para p = a, as funções modificadas de Bessel, Seção 11.5, são envolvidas. 
sem = 0, fator 2 é omitido (compare com a Equação (14.16). 
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uma variável contínua a. Uma situação similar é encontrada na série de Fourier, Seção 15.2. O desenvolvimento 
da integral de Bessel a partir da série de Bessel fica para o Exercício 11.2.8. 

Para operações com um contínuo de funções de Bessel, J, (ap), uma relação fundamental é a equação de 
fechamento da função de Bessel, 


j Jy (ap)Ju (a p)pdp = tia — o), v> si (11.59) 
0 Q 


Isso pode ser provado pela utilização de transformadas de Hankel, Seção 15.1. Uma abordagem alternativa, 
partindo de uma relação similar à Equação (10.82), é dada por Morse e Feshbach, Seção 6.3. Na Seção 11.7 é 
desenvolvido um segundo tipo de ortogonalidade (variando o índice) para funções de Bessel esféricas. 


Exercícios 
11.2.1 Mostre que 


P 
(a? — b?) f Jy(ax)J, (bae)x de = P|bJ (aP) J, (bP) — aJ} (aP) J (bP)], 


J; (aP) = A 


d(ax) Ed 


f Uasyf ndo = TSP? + (1 — H) Lar). DR 


Essas duas integrais costumam ser denominadas primeira e segunda integrais de Lommel. 
Sugestão: Temos o desenvolvimento da ortogonalidade das funções de Bessel como uma analogia. 


11.2.2 Mostre que 
a 2 2 
f Ç (om2) pdp = irala v>-l. 
0 a 2 


Aqui, Gym é O m-ésimo zero de J,. 
Sugestão: Com Qyn = Qym +E, expanda Jy |(&aym +e) p/a] em torno de am p/a por uma expansão 
de Taylor. 


11.2.3 (a) Se 8,m é o m-ésimo zero de (d/do)J,(B,mP/a), mostre que as funções de Bessel são 
ortogonais no intervalo [0, a] com uma integral de ortogonalidade 


J J( bumt) (8E) pao =0, m £n, v>—l. 
0 a a 


(b) Derive a integral de normalização correspondente (m = n). 


v2 


z) Er e v>-l. 


11.2.4 Verifique se a equação de ortogonalidade, Equação (11.49), e a equação de normalização, 
Equação (11.50), valem para v > —1. 
Sugestão: Usando expansões de série de potências, examine o comportamento da Equação (11.48) 
quando p — 0. 


a2 
Resposta: ER (1 — 


11.2.5 Pela Equação (11.49) desenvolva uma prova de que J,(z),v > —1 não tem raízes complexas (com 
parte imaginária não-zero). 
Sugestão: 


(a) Use a forma de série de J,(z) para excluir raízes imaginárias puras. 
(b) Admita que a,m é complexa e considere &yn como až m- 


11.2.6 (a) Na expansão de série 


= p 
E vm dy vm” |» 0< <a, =i; 
FO) = 5 condi (com) p<a, > 


m=1 
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com J, (cm) = 0, mostre que os coeficientes são dados por 


Gm = a aLe zj“ Flo (arm! Joao 
Jy41 (Qvm)] 


(b) Na expansão de série 


p= dondo(9me), 0O<p<a, v>-l, 


com (d/dp) J(B,mP/a) |p=a= 0, mostre que os coeficientes são dados por 


= P 
ie 5 a? (1 T EE Bum) id F(p (o, ne Joan 


11.2.7 Um cilindro circular reto tem um potencial eletrostático de «)(p, 4) em ambas as extremidades. 
O potencial sobre a superfície cilíndrica curvada é zero. Ache o potencial em todos os pontos 
interiores. 

Sugestão: Escolha seu sistema de coordenadas e ajuste sua dependência z para explorar a simetria 
de seu potencial. 


11.2.8 Para o caso do contínuo, mostre que as Equações (11.51) e (11.52) são substituídas por 


=Q a Fo) Jolap)p dp. 
Sugestão: O caso correspondente para senos e co-senos é estudado na Seção 15.2. Essas são 


transformadas de Hankel. Uma derivação para o caso especial v = 0 é o tópico do Exercício 15.1.1. 


11.2.9 Uma função f(x) é expressa como uma série de Bessel: 


-5 And) male) 


sendo amn a enésima raiz de Jm. Prove a relação de Parseval, 


1 1 So 
I [oz dx = E 5 a2 [ga load] 
n=1 
11.2.10 Prove que 
ES 1 
=! E 
qem = mai) 


Sugestão: Expanda x” em uma série de Bessel e aplique a relação de Parseval. 


11.2.11 Um cilindro circular reto de comprimento l tem um potencial 


Roe), 


em que a é o raio. O potencial sobre a superfície curvada (lateral) é zero. Usando a série de Bessel do 
Exercício 11.2.7, calcule o potencial eletrostático para p/a = 0,0(0,2)1,0 e z/l = 0,0(0,1)0,5. 
Considere a/l = 0,5. 

Sugestão: Pelo Exercício 11.1.30 você tem 


| Q- i)o 
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Mostre que isso é igual a 
1 on 


— Jo(y) dy. 


Gon Jo 
A avaliação numérica desta última forma, em vez da primeira, é mais rápida e também mais exata. 
Nota: Para p/a = 0,0 e z/l = 0,5 a convergência é lenta, sendo que 20 termos dão apenas 98,4 
em vez de 100. 
Valor de verificação. Para p/a = 0, 4 e z/l = 0,3, 
Y = 24,558. 


11.3 Funções de Neumann e Funções de Bessel da Segunda Espécie 

Pela teoria das EDO, sabe-se que a equação de Bessel tem duas soluções independentes. De fato, para ordem v não- 
inteira já encontramos duas soluções e as denominamos J, (x) e J-., (x), usando a série infinita (Equação (11.5)). 
O problema é que, quando v é inteiro, a Equação (11.8) vale e temos só uma solução independente. Uma segunda 
solução pode ser desenvolvida pelos métodos da Seção 9.6, o que resulta em uma segunda solução bastante boa da 
equação de Bessel, mas não é a forma padrão. 


Definição e Forma de Série 


Como uma abordagem alternativa, tomamos a combinação linear particular de J, (x) e J.,(x) 


Na = cos vr Jy (x) — Tola) 


(11.60) 


sen vm 


Essa é a função de Neumann (Figura 11.5).!º Para v não-inteiro, N, (x), claramente satisfaz a equação de Bessel, 
porque é uma combinação linear de soluções conhecidas J (x) e J-,(x). Substituindo a série de potências da 
Equação (11.6) por n — v (dado no Exercício 11.1.7), temos como resultado 


A 


> x 


N, (x)= — (3) da ava tO (11.61) 


para v > 0. Contudo, para v inteiro, v = n, a Equação (11.8) se aplica e a Equação (11.60)!9 torna-se 
indeterminada. A definição de N,(ax) foi escolhida deliberadamente por essa propriedade de indeterminação. 
Novamente substituindo a série de potências e avaliando N, (x) para v — 0 pela regra de l Hôpital para formas 
indeterminadas, obtemos o valor limitador 


No(x) = 2 ing +7- n2) +0?) , (11.62) 


I5Em AMS-55 (veja nota de rodapé 4 no Capítulo 5 ou Leituras Adicionais do Capítulo 8 para essa referência); na maioria das tabelas 
matemáticas, ela é rotulada Y, (x). 
!6Note que essa forma limitadora se aplica a valores inteiros e não-inteiros do índice v. 
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para n = 0 e x — 0, usando 
u(=v)! = — (11.63) 


sen TY 


da Equação (8.32). O primeiro e o terceiro termos na Equação (11.62) vêm da utilização de (d/dv)(x/2)” = 
(x/2)” ln(x/2), enquanto y vem de (d/dv)v! para v — O usando as Equações (8.38) e (8.40). De modo 
semelhante, para n > 0, obtemos 


Na) = -2 D(F) +Z) an(s) + (11.64) 
T z T\2j n! 2 


As Equações (11.62) e (11.64) exibem a dependência logarítmica que era de esperar. Isso, é claro, verifica a 
independência de J e Nn. 


Outras Formas 


Como acontece com todas as outras funções de Bessel, N, (x) tem representações integrais. Para No(x) temos 


2e 2 fe (ut 
No(x) = s cos(x cosh t) dt = a Pra dt, x >0. 


Essas formas podem ser derivadas como a parte imaginária das representações de Hankel do Exercício 11.4.7. A 
última forma é uma transformada de Fourier de co-seno. 

Para verificar que N, (x), nossa função de Neumann (Figura 11.5) ou função de Bessel da segunda espécie 
realmente satisfaz a equação de Bessel para n inteiro, podemos continuar como segue. A regra de L’ Hôpital 
aplicada à Equação (11.60) resulta em 


_ (d/dv)jcos va J(a) — J- (x)] 

Na(2) = (d/dv)sen vr Eos 
_ nsen nr Jn(x) + [cosnrdJ,/dv — 9J-,/0vV],=n 
= T COS NT 
_ 1[8J (x) nJ- (£) 
=i | F (—1) Ə ar (11.65) 

Diferenciando a equação de Bessel para J+, (x) em relação a v, temos 
d? (0Js d (0J+ OJ+ 
2 +v +v 2E a di tv a f 
£ q2 2» ) tea dp ) + (a V ) dp 2vJ+y (11.66) 


Multiplicando a equação para J., por (—1)”, subtraindo da equação para J, (como sugerido pela 
Equação (11.65)) e considerando o limite v — n, obtemos 


PN ISN + (2? — n?) Nn = Mig — (—1)” J-a] (11.67) 
Para v = n, inteiro, o lado direito desaparece pela Equação (11.8) e Nn (x) é considerada uma solução da equação 
de Bessel. Por conseguinte, a solução mais geral para qualquer v pode ser escrita como 


y(x) = AJ (x) + BN, (x). (11.68) 


Pelas Equações (11.62) e (11.64) vemos que N, diverge, ao menos de forma logarítmica. Qualquer condição de 
contorno que exija que a solução seja finita na origem (como em nossa membrana circular vibratória, Seção 11.1, 
automaticamente exclui N, (x). Ao contrário, na ausência de tal requisito, N, (x) deve ser considerada. 

Até certo ponto, a definição da função de Neumann N, (x) é arbitrária. As Equações (11.62) e (11.64) contêm 
termos da forma a, Jn (x). Claramente, qualquer valor finito da constante an ainda nos daria uma segunda solução 
da equação de Bessel. Por que a, teria o valor particular implícito nas Equações (11.62) e (11.64)? A resposta 
envolve a dependência assintótica desenvolvida na Seção 11.6. Se J, corresponder a uma onda co-senoidal, então 
Nn corresponde a uma onda senoidal. Essa simples e conveniente relação de fase assintótica é uma conseqiiência 
da mistura particular de J, em Nn. 
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Relações de Recorrência 

Substituindo a Equação (11.60) por N, (x) (v não-inteiro ) nas relações de recorrência (Equações (11.10) e (11.12)) 
por Jn(x), vemos imediatamente que N, (x) satisfaz essas mesmas relações de recorrência. Na verdade, isso 
constitui uma outra prova de que N, é uma solução. A que o inverso não é necessariamente verdadeiro. As soluções 
não precisam satisfazer as mesmas relações de recorrência. Um exemplo desse tipo de confusão aparece na Seção 
11.5. 


Fórmulas Wronskianas 
Pela Seção 9.6 e Exercício 10.1.4 temos a fórmula wronskiana!” para soluções da equação de Bessel, 


u(x)v! (x) — u! (xju (£) = —, (11.69) 


na qual 4, é um parâmetro que depende de considerar as funções particulares de Bessel u, (x) e vy (x). A, é uma 
constante no sentido de que é independente de x. Considere o caso especial 


uva) = Jo(a), lr) =J) (11.70) 


Av 
VED EE H EEA (11.71) 
HH 


Visto que 4, é uma constante, ela pode ser identificada em qualquer ponto conveniente, tal como x = 0. Usando 
os primeiros termos nas expansões de série (Equações (11.5) e (11.6)), obtemos 


V PA ud 
Jy x Joy 
227! (—v)! 
va” v2”y “1 
J' J' 2 ; 11.72 
a 2y!’ Za (—v)! ( ) 
Substituindo na Equação (11.69), temos 
; j —2v 2sen vT 
Jy (x)J (x) — Jp (x£)J-u (£) = = ; (11.73) 
avi(—v)! Ta 


usando a Equação (8.32). Note que 4, se anula parta v inteiro, como deve, uma vez que o wronskiano não ser nulo 
é um teste da independência das duas soluções. Pela Equação (11.73), fica claro que Jn e J-n são linearmente 
dependentes. 

Usando nossas relações de recorrência, podemos imediatamente desenvolver um grande número de formas 
alternativas, entre elas 


2 
TIRET a A eE, (11.74) 
TX 
2 
TE E da (11.75) 
TX 
1 È 2 
J N! — JN, = —, (11.76) 
TX 
2 
INi = J aN; = (11.77) 
TX 


Muitas mais serão encontradas nas referências apresentadas no final do capítulo. 

Lembre-se de que no Capítulo 9 os wronskianos eram de grande valor sob dois aspectos: (1) para estabelecer a 
independência linear ou a dependência linear de soluções equações diferenciais e (2) para desenvolver uma forma 
integral de uma segunda solução. Aqui, as formas específicas das combinações de funções de Bessel wronskianas 
e derivadas de wronskianos são úteis primordialmente para ilustrar o comportamento geral das várias funções de 
Bessel. Wronskianos são muito úteis para verificar tabelas de funções de Bessel. Na Seção 10.5 os wronskianos 
apareciam em conexão com funções de Green. 


1 Esse resultado depende de P(x), da Seção 9.5, ser igual a p'(x:)/p(x:), o coeficiente correspondente da forma auto-adjunta da Seção 10.1. 
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Exemplo 11.3.1 GUIAS DE ONDA COAXIAIS 

Estamos interessados em uma onda eletromagnética confinada entre as superfícies condutoras cilíndricas 
concêntricas p = a e p = b. Grande parte da matemática é elaborada na Seção 9.3 e no Exemplo 11.1.2. Para 
ir da onda estacionária desses exemplos para a onda progressiva, que é o caso aqui, fazemos A = iB,A = 
amn, B = bmn na Equação (11.404) e obtemos 


E, = 5y bmn Jml ype? eike, (11.78) 


m,n 


Propriedades adicionais das componentes da onda eletromagnética no guia de onda cilíndrico simples são 
exploradas nos Exercícios 11.3.8 e 11.3.9. Para o guia de onda coaxial é preciso uma generalização. A origem, 
p = 0, agora é excluída (0 < a < p < b). Daí, a função de Neumann Nm (yp) pode não ser excluída. E, (p, p, z, t) 
se torna 


E; = X [bmn Im(4P) + Emn Nm hap)] ereto, (11.79) 


Com a condição 
H, = 0, (11.80) 


temos as equações básicas para uma onda TM (modo transversal magnético). 
O campo elétrico (tangencial) deve desaparecer nas superfícies condutoras (condição de contorno de Dirichlet), 
ou 
bmnJm(ya) Io CmnNm(Ya) E 0, (11.81) 


bmn Im (7) + Cmn Nm(yb) = 0. (11.82) 


Essas equações transcendentais podem ser resolvidas para Y(Ymn ) € a razão Cmn /bmn. Pelo Exemplo 11.1.2, 


k? = w moo -V = (11.83) 
Uma vez que k? deve ser positiva para uma onda real, a freqüência mínima que será propagada (nesse modo TM) 
é 

w =, (11.84) 


com y fixado pelas condições de contorno, Equações (11.81) e (11.82). Essa é a fregiiência de corte do guia de 
onda. 

Também há um modo TE (transversal elétrico), com E, = 0 e H, dado pela Equação (11.79). Então, temos 
condições de contorno de Neumann em vez das Equações (11.81) e (11.82). Por fim, para o guia coaxial (não para 
o guia cilíndrico simples, a = 0), um TEM (modo transversal eletromagnético), E, = H, = 0, é possível. Isso 
corresponde a uma onda plana, como em espaço livre. 

Incluímos os casos mais simples (nenhuma função de Neumann, condições de contorno mais simples) de um 
guia de onda circular nos Exercícios 11.3.8 e 11.3.9. 

Para concluir essa discussão de funções de Neumann, introduzimos a função de Neumann N, (x) pelas seguintes 
razões: 

1. É uma segunda solução, independente, da equação de Bessel, que completa a solução geral. 

2. É requerida para problemas físicos específicos, tais como ondas eletromagnéticas em cabos coaxiais e teoria de 
espalhamento da Mecânica Quântica. 

3. Leva à função de Green para a equação de Bessel (Seções 9.7 e 10.5). 

4. Leva diretamente a duas funções de Hankel (Seção 11.4). E 


Exercícios 
11.3.1 Prove que a funções de Neumann N, (sendo n inteiro) satisfazem as relações de recorrência 


Na-i(x) + Nnsi(x) = z Me), 
Nn-1(£) — Nng (£) = 2N} (£). 


Sugestão: Essas relações podem ser provadas diferenciando as relações de recorrência para J, ou 
usando a forma de limite de N,, mas não dividindo tudo por zero. 


ELSEVIER 
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11.3.2 


11.3.3 


11.3.4 


11.3.5 


11.3.6 


11.3.7 


11.3.8 


11.3.9 


Mostre que 
É Non(a) = (—1)” Nn (£). 


Mostre que 
No(z) = -N1 (2). 


Se Y e Z são duas soluções quaisquer da equação de Bessel, mostre que 


Y (2)Zp (z) — Y, (z)Zy (2) = —, 


V 


na qual A, pode depender de v mas é independente de x. Esse é um caso especial do Exercício 
10.1.4. 


Verifique as fórmulas wronskianas 


TOORE ORO = 22, 
Jo (£) N! (x) — J; (£)N, (£) = + 


Como alternativa a deixar que x se aproxime de zero na avaliação da constante wronskiana, 
podemos invocar a unicidade de séries de potências (Seção 5.7). Então, o coeficiente de x”! na 
expansão de série de u,(a)vi, (x) — ui (a)v,(x) é Ay. Mostre por expansão de série que cada um 
dos coeficientes de x? e x! de Jy (x)JL (£) — J} (x)J—u (x) é zero. 


(a) Por diferenciação e substituição na EDO de Bessel, mostre que 
f cos(x cosh t) dt 
0 


é uma solução. 
Sugestão: Você pode rearranjar a integral final como 


A an (a cos ht)senh t} dt. 
o dt 


(b) Mostre que 
2 oo 
No(x) = -2 f cos(xcosh t) dt 
0 


T 
é linearmente independente de Jo(x). 

Um guia de onda cilíndrico tem raio ro. Ache as componentes que não desaparecem dos campos 

elétrico e magnético para 

(a) TMo, onda transversal magnética (H, = H, = E, = 0), 

(b) TEo1, onda transversal elétrica (E, = E, = Ho = 0). 

Os índices 01 indicam que a componente longitudinal (E. ou H,) envolve Jy e a condição de 


contorno é satisfeita pelo primeiro zero de Jo ou Jg. 
Sugestão: Todas as componentes da onda têm o mesmo fator: exp i(kz — wt). 


Para um dado modo de oscilação, a fregiência mínima que será passada por um guia de onda 
cilíndrico circular (raio ro) é 


Cc 

Vmín = 1 
A 

C 


na qual À< é fixado pela condição de contorno 


2170 
Jn SN =0 para modo TM,,m, 


2 
( mn) =0 para modo TEņnm.- 


O índice n denota a ordem da função de Bessel e m indica o zero usado. Ache esse comprimento 
de onda de corte Ac para os três modos TM e os três modos TE que tenham os mais longos 
comprimentos de onda de corte. Explique seus resultados em termos do gráfico de Jo, Jı e J2 
(Figura 11.1). 
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11.3.10 


11.3.11 


Escreva um programa para calcular raízes sucessivas da função de Neumann N, (x), isto é, ans, 
em que Na(ans) = 0. Tabule as cinco primeiras raízes de No, Nı e No. Compare os valores 
que encontrou para as raízes com os relacionados em AMS-55 (referência completa fornecida em 
Leituras Adicionais do Capítulo 8). 

Valor de verificação a12 = 5, 42968. 


Para o caso m = 0,a = 1 e b = 2, as condições de contorno do guia de onda coaxial levam a 


_ Soo) o(a) 


Ha) No(2x) Nol) 


(Figura 11.6). 


Jo 2x) Jo (9) 
sh No (2x) No (x) 


Figura 11.6: f(x) do Exercício 11.3.11. 


(a) Calcule f(x) para x = 0,0(0,1)10,0 e esboce f(x) versus x para achar a localização 
aproximada das raízes. 
(b) Chame uma sub-rotina de busca de raízes para determinar as primeiras três raízes com maior 
precisão. 
Resposta: 3,1230, 6,2734, 9,4182. 


Nota: É de esperar que as raízes mais altas apareçam em intervalos cujos comprimentos se 
aproximem de n. Por quê? AMS-55 (referência fornecida em Leituras Adicionais do Capítulo 8) dá 
uma fórmula aproximada para as raízes. A função g(x) = Jo(x) No(2x) — Jo(2x)No(x) é muito 
mais bem-comportada do que f(x) discutida anteriormente. 


11.4 Funções de Hankel 


Muitos autores preferem introduzir funções de Hankel por meio de representações integrais e então usá-las para 
definir a função de Neumann N, (2). Um resumo dessa abordagem é apresentado no final desta seção. 


Definições 


Como já obtivemos a função de Neumann por técnicas mais elementares (e menos poderosas), podemos usá-la 
para definir as funções de Hankel HSM (x) e HP (x): 


H® (x) = J (x) + iN, (x) (11.85) 


HP (x) = J (£) — iN, (x). (11.86) 
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Isso é exatamente análogo a considerar 


e? = cos O + isen 6. (11.87) 


; 1 2) a . 3 
Para argumentos reais, H, í Je H, t ) são conjugados complexos. Poderemos ver ainda melhor a extensão dessa 
analogia quando forem consideradas as formas assintóticas (Seção 11.6). Na verdade, é o comportamento 
assintótico das funções de Hankel que as torna úteis. 


Expansões de série de H, W (x)e H p) (x) podem ser obtidas combinando as Equações (11.5) e (11.63). Muitas 
vezes apenas o primeiro termo é de interesse; ele é dado por: 


HP (a) x me + 1H m2) +, (11.88) 
na) iE) +... PSU (11.89) 
HÊ (æ) = -imr +120- m) +, (11.90) 
nP mL N g, EN (11.91) 


Uma vez que as funções de Hankel são combinações lineares (com coeficientes constantes) de J, e N, elas 
satisfazem as mesmas relações de recorrência (Equações (11.10) e (11.12)) 


H,_(£) + Hon(z) = > mo), (11.92) 
H,a(x) — Hon(x) = 2H! (£), (11.93) 


para HO (a) e HP (x). 
Uma variedade de fórmulas wronskianas pode ser desenvolvida: 
4 


(1) (BD 
HO HV? =» HPHP Soi (11.94) 
2 
J, H® per HD, = Fam (11.95) 
2 
IH - JHP = — (11.96) 


Exemplo 11.4.1 ONDAS PROGRESSIVAS CILÍNDRICAS 
Como ilustração da utilização de funções de Hankel, considere um problema de onda bidimensional similar ao 
da membrana circular vibratória do Exercício 11.1.25. Agora, imagine que as ondas são geradas em r = 0 e 
se movem para fora até o infinito. Substituímos nossas ondas estacionárias por ondas progressivas. A equação 
diferencial permanece a mesma, mas as condições de fronteira mudam. Agora impomos que, para r grande, a onda 
se comporte como 

U m elkr) (11.97) 
para descrever uma onda de saída. Como antes, k é o número da onda. Com isso admitimos, por simplicidade, 
que não há nenhuma dependência azimutal, isto é, nenhum momento angular ou m = 0. Nas Seções 7.3 e 11.6, 
mostramos que HP (kr) tem o comportamento assintótico (para r — 00) 


HEP (kr) ~ er. (11.98) 
Então, essa condição de contorno no infinito determina que nossa solução de onda é 
U(r, t) = HP (krje t. (11.99) 


Essa solução diverge quando r — 0, que é o comportamento esperado com uma fonte na origem. 

A escolha de um problema com onda bidimensional para ilustrar a função de Hankel H, 9 (z) não é acidental. 
Funções de Bessel podem aparecer em uma variedade de modos, tal como na separação de coordenadas cônicas. 
Todavia, o mais comum é elas entrarem nas equações radiais decorrentes da separação de variáveis na equação 
de Helmholtz em coordenadas polares cilíndricas e esféricas. Para essa ilustração consideramos uma forma 
degenerada de coordenadas cilíndricas. Se tivéssemos usado coordenadas polares esféricas (ondas esféricas), 
teríamos encontrado índice v = n + > sendo n inteiro. Esses valores especiais resultam nas funções de Bessel 
esféricas que serão discutidas na Seção 11.7. E 
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Representações de Integral de Contorno das Funções de Hankel 
A representação integral (integral de Schlaefli) 


1 x/2)(t—1/t dt 
J (£) = TE Va a (11.100) 


pode ser estabelecida com facilidade como uma integral de Cauchy para v = n, inteiro (reconhecendo que o 
numerador é a função geradora (Equação (11.1)) e integrando ao redor da origem). Se v não for inteiro, o integrando 
não é de valor único e precisamos de uma linha de corte em nosso plano complexo. Escolhendo o eixo real negativo 
como a linha de corte e usando o contorno mostrado na Figura 11.7, podemos estender a Equação (11.100) para 
v não-inteiro. Substituindo a Equação (11.100) na EDO de Bessel, podemos representar o integrando combinado 
por uma diferencial exata que se anula à medida que t — ooet!" (compare com o Exercício 11.1.16). 


RITO) 
N 


RO 


Figura 11.7: Contorno da função de Bessel. 


Agora, deformamos o contorno de modo que ele se aproxime da origem ao longo do eixo real positivo, como 
mostrado na Figura 11.8. Para x > 0, essa aproximação particular garante que a diferencial exata mencionada 
desaparecerá à medida que t — O por causa do fator e—”/2! — 0. Por conseguinte, cada uma das porções separadas 
(00 e*7 to 0) e (0 to œo e'”) é uma solução da equação de Bessel. Definimos 


3 (1) 
A 


RO 


Figura 11.8: Contornos da função de Hankel. 


H® (x) = 1 a e@/D0-1/t) d (11.101) 
v ri 0 p+HI? 
0 
HO (a) = =| epa do (11.102) 
v ri q 4+1 


Essas expressões são particularmente convenientes porque podem ser manipuladas pelo método das inclinações 
mais acentuadas (Seção 7.3). HP (x) tem um ponto de sela em t = +i, enquanto HP (x) tem um ponto de sela 
emt = —t. 

O problema de relacionar as Equações (11.101) e (11.102) à nossa definição anterior da função de Hankel 
(Equações (11.85) e (11.86)) permanece. Uma vez que as Equações (11.100) a (11.102) combinadas resultam em 


[HP (x) + HP (a)], (11.103) 


NI = 


J (x) = 
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por inspeção, precisamos apenas mostrar que 


[HP (£) — HP (2)]. (11.104) 


Isso pode ser conseguido pelas seguintes etapas: 
1. Com as substituições t = et" /s por HP et= e 'T /s por HO), obtemos 


HO (a) = er HO (a), (11.105) 


HO (x) = “HO (a). (11.106) 
2. Pelas Equações (11.103) (v — —v), (11.105) e (11.106), 


Aa s 
J(e) =3 fe” HP (x) + e” HP (x)]. (11.107) 


3. Finalmente, substituímos J, (Equação (11.103)) e J—, (Equação (11.107)) na equação definidora para N,, 
Equação (11.60). Isso leva à Equação (11.104) e estabelece as integrais de contorno Equações (11.101) e 
(11.102) como as funções de Hankel. 


Representações integrais já apareceram antes: Equação (8.35) para T (z) e várias representações de J, (z) na Seção 
11.1. Com essas representações integrais das funções de Hankel, talvez seja adequado perguntar por que estamos 
interessados em representações integrais. Há no mínimo quatro razões. A primeira é o simples atrativo estético. A 
segunda é que as representações integrais ajudam a distinguir entre duas soluções linearmente independentes. Na 
Figura 11.6, os contornos C1 e C2 cruzam pontos de sela diferentes (Seção 7.3). Para as funções de Legendre, o 
contorno para P, (2) (Figura 12.11) e o contorno para Q, (z) circundam pontos singulares diferentes. 

A terceira é que as representações integrais facilitam manipulações, análise e o desenvolvimento de relações 
entre as várias funções especiais. A quarta, e provavelmente a mais importante de todas, é que as representações 
integrais são de extrema utilidade no desenvolvimento de expansões assintóticas. Uma abordagem do método 
de inclinações mais acentuadas aparece na Seção 7.3. Uma segunda abordagem, a expansão direta de uma 
representação integral, é dada na Seção 11.6 para a função modificada de Bessel K, (z). Essa mesma técnica pode 
ser usada para obter expansões assintóticas das funções hipergeométricas confluentes M e U, Exercício 13.5.13. 

Concluindo, as funções de Hankel são introduzidas aqui pelas seguintes razões: 

e Como análogas de e+!” elas são úteis para descrever ondas progressivas. 
e Elas oferecem uma definição alternativa (contorno integral) e bastante elegante de funções de Bessel. 
° HP é usada para definir a função modificada de Bessel K, da Seção 11.5. 


Exercícios 
11.4.1 Verifique as fórmulas wronskianas 


@) J (x) HP (£) — JU) HP (x) = qa 
b) IH? (2) — JU) HP (x) = E 
(O No(s) HE (2) — Ni (2) HO (a) = 2 
(O) NH? (1) - NUM HO (x) = 2, 
(©) HP (HP (x) — HP (HP (a) = =E, 
O HP (HO (x) - HO (HP (x) = É, 


O (HD (1) - I)HO (0) = 2. 


11.4.2 Mostre que as formas integrais 


pes” dt 
(a) F dC Ad = HP (x), 


iT Joc t” 
I i dt 

(b) — / de = HP (a) 
IT Jooe-irC, t 


satisfazem a EDO de Bessel. Os contornos C1 e C2 são mostrados na Figura 11.8. 
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11.4.3 


11.4.4 


11.4.5 


11.4.6 


11.4.7 


Usando as integrais e contornos dados no Exercício 11.4.2, mostre que 
1 
= [EP (2) - HP (e) = No(a). 

i 


Mostre que as integrais no Exercício 11.4.2 podem ser transformadas para dar como resultado 


1 1 
(a) HP (x) = =| ersenh Y—vY dy, (b) HP (a) Spas ersenh Y—vy dy 
VIRA Cs MTU Ĝi 


(veja a Figura 11.9). 
œo + iT 
Å— aI‘ 


in o -— it 


Figura 11.9: Contornos de função de Hankel. 
(a) Transforme HO (x), Equação (11.101), em 


1 ; 
HO (a) ne E E ad ds, 


em que o contorno C vai de —oo — ix /2 passando pela origem do plano s até oo + im /2. 
(b) Justifique reescrevendo HP (x) como 


2 oo+ir/2 


HO (x Ema et? cosh s ds 
ú iT Jo 
(c) Verifique que essa representação integral realmente satisfaz a equação diferencial de Bessel. 


(in/2 no limite superior não é essencial. Serve como um fator de convergência. Podemos 
substituí-lo por iar /2 e considerar o limite.) 


Por Ji 
HO (a) = zf e't cosh s ds 
0 


iT 
mostre que 


(a) Jo(z)= fo sen (x cosh s) ds, O DA= T 


Por (veja os Exercícios 11.4.4 e 11.4.5) 


PA CE 
Paf eir osb sds 
0 


UT 


mostre que 
oo 


(a) No(x) = -2f cos(a cosh s) ds. 
T Jo 
2 cos(xt) di 


Th VED” 


Essas são as representações integrais na Seção 11.3. 


(b) No(x) = 


Esse último resultado é uma transformada de Fourier de co-seno. 
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11.5 Funções Modificadas de Bessel T, (x) e K, (x) 
A equação de Helmholtz, 


Vºp+Rp=o0, 


separada em coordenadas cilíndricas circulares, leva à Equação (11.22a), a equação de Bessel. A Equação (11.22a) 
é satisfeita pelas funções de Bessel e Neumann J, (kp) e N,(kp) e qualquer combinação linear, tal como as funções 
de Hankel HS” (kp) e H, o) (kp). Agora, a equação de Helmholtz descreve a parte espacial de fenômenos de onda. 
Se, em vez disso, tivermos um problema de difusão, então a equação de Helmholtz é substituída por 


V?y — k?y = 0. (11.108) 


A análoga da Equação (11.22a) é 
2 P d 2,2 2 
PY, (kp) + 9 Yo (ko) — (k2pº + 2) Yo (kp) = 0. (11.109) 
dp? dp 


A equação de Helmholtz pode ser transformada na equação de difusão pela transformação k — ik. De modo 
semelhante, k — ik muda a Equação (11.22a) para a Equação (11.109) e mostra que 


Y(kp) = Z, (ikp). 


As soluções da Equação (11.109) são funções de Bessel de argumento imaginário. Para obter uma solução que 
é regular na origem, consideramos Z, a função regular de Bessel J,. E costumeiro (e conveniente) escolher a 
normalização de modo que 


Y, (x) = I (£) = i” J (ix). (11.110) 


(Aqui, a variável kp está sendo substituída por x por simplicidade.) A normalização 17” extra cancela os i” de 
cada termo e transforma 1, (x) em real. Muitas vezes isso é escrito como 


I (x£) = eJ, en): (11.111) 


Io e 1, são mostradas na Figura 11.10. 


Figura 11.10: Funções modificadas de Bessel. 
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Forma de Série 


Em termos de série infinita, isso equivale a remover o sinal (—1)º na Equação (11.5) e escrever 


oo 1 = 2s+v oo 1 = 28s—v 
I (£) = ~| j I (£) = T | > : 11.112 
(2) Dto) (2) Sato) ( ) 
Para v inteiro essa expressão dá como resultado 
Tala) = Ion(a). (11.113) 


Relações de Recorrência 


As relações de recorrência satisfeitas por T, (x) podem ser desenvolvidas pelas expansões de série, mas talvez 
seja mais fácil trabalhar a partir das relações de recorrência existentes para J, (x). Vamos substituir x por —ix e 
reescrever a Equação (11.110) como 


Ja) = i I, (~iz). (11.114) 


Então, a Equação (11.10) se torna 


i, (ix) +i Iir) = > I(-ia). 


Substituindo x por ix, temos a relação de recorrência para 1, (x), 


2 
La(x) — L(z) = Ia). (11.115) 
A Equação (11.12) se transforma em 
I,-a(a) + Ip (£) = 21(x). (11.116) 


Essas são as relações de recorrência usadas no Exercício 11.1.14. Vale a pena destacar que, embora duas relações 
de recorrência, Equações (11.115) e (11.116) ou o Exercício 11.5.7, especifiguem a EDO de segunda ordem, o 
inverso não é verdadeiro. A EDO não fixa unicamente as relações de recorrência. As Equações (11.115) e (11.116) 
e o Exercício 11.5.7 dão um exemplo. 

Pela Equação (11.113) vê-se que temos apenas uma solução independente quando é um inteiro exatamente 
como nas funções de Bessel J,. A escolha de uma segunda solução independente da Equação (11.108) é, 
em essência, uma questão de conveniência. A segunda solução dada aqui é selecionada com base em seu 
comportamento assintótico — como mostraremos na próxima seção. A confusão de escolha e notação para essa 
solução talvez seja maior do que em qualquer outro lugar dessa área.!º Muitos autores!” preferem definir uma 


segunda solução em termos da função de Hankel H 9 (x) por 


T 


Ka) = qt HP (ia) = pda [J (ix) + iN, (i£)]. (11.117) 


O fator i” +! torna K, (x) real quando z é real. Usando as Equações (11.60) e (11.110), podemos transformar a 
Equação (11.117) em”? 
Lola) — 1 
Kulx) = 2 (2) (2). (11.118) 


2 sen VT 


análoga à Equação (11.60) para N, (x). A escolha da Equação (11.117) como definição é um tanto infeliz, no 
sentido de que a função K,(x) não satisfaz as mesmas relações de recorrência que I, (x) (compare com os 
Exercícios 11.5.7 e 11.5.8). Para evitar esse aborrecimento, outros autores?! incluíram um fator adicional de 


!8Encontramos uma discussão e comparação de notações em Math. Tables Aids Comput. 1: 207-308 (1944). 
watson, Morse ed Feshbach, J effreys e Jeffreys (sem o 7/2). 

20Para índice inteiro n consideramos o limite v > n. 

2?! Whittaker e Watson, veja Leituras Adicionais do Capítulo 13. 
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cos Vm, o que permite que K, satisfaça as mesmas relações de recorrência que as [,, mas tem a desvantagem 
de fazer K, = 0 para v = 2,3,5... 

A expansão de série de K, (x) resulta diretamente da forma de série de H O (ia). Os termos de ordem mais 
baixa são (confrontar as Equações (11.61) e (11.62)) 


Ko(x)=—-lnz-y+ln2 +., 
K (£) =2""v— Dig" +. (11.119) 


Como a função modificada de Bessel 7, está relacionada à função de Bessel J,, tanto quanto senh está relacionada a 
seno, I, e a segunda solução K, às vezes são denominadas funções hiperbólicas de Bessel. Ko e Kı são mostradas 
na Figura 11.10. 

To(x) e Ko(ax) têm as representações integrais 


1 T 
Io(£) = | cosh(a cos 0) do, (11.120) 
T Jo 
X: © cos(at) dt 
K = 3 ht)dt = a io 0. 11.121 
olz) i cos(xsenh t) | TESNE DS ( ) 


A Equação (11.120) pode ser derivada da Equação (11.30) para Jo(x) ou pode ser considerada um caso especial 
do Exercício 11.5.4, v = 0. A representação integral de Ko, Equação (11.121), é uma transformada de Fourier 
e pode ser mais bem derivada com transformadas de Fourier, Capítulo 15, ou com funções de Green, Seção 9.7. 
Uma variedade de outras formas de representações integrais (incluindo v # 0) aparece nos exercícios. Essas 
representações integrais são úteis no desenvolvimento de formas assintóticas (Seção 11.6) e em conexão com 
transformadas de Fourier, Capítulo 15. 

Para colocar as funções modificadas de Bessel 1, (x) e K,(a) na perspectiva adequada, nós as introduzimos 
aqui porque: 
e Essas funções são soluções da equação modificada de Bessel, uma equação encontrada com muita fregiiência. 
e Elas são necessárias para problemas físicos específicos, tais como os de difusão. 
e K,(x) dá uma função de Green, Seção 9.7. 
e K,(x) leva a uma determinação conveniente de comportamento assintótico (Seção 11.6). 


Exercícios 
11.5.1 Mostre que 


e(/2D(6+1/t) — 5 Tala)”, 


gerando assim funções modificadas de Bessel, Ta (£). 


11.5.2 Verifique as PEUN identidades 


(a) 1= To(x ORE )"Ion(a 


(b) e” (8) +23. hu) 
© e =I G45 Gi 1)” In ( 
n=1 


(d) cosha = To(x) +2 5 Ioan (£) 


(e) senh z = 2 X` Iani (2) 
n=1 


11.5.3 (a) Pela função geradora do Exercício 11.5.1, mostre que 


h(a) = 55 f elede 1/0] 
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(b) Para n = v, não sendo inteiro, mostre que a representação integral precedente pode ser 
generalizada para 
dt 


Le) = z | elede] 


O contorno € é o mesmo que o contorno para J, (x), Figura 11.7. 


11.5.4 Parav > -— > mostre que 1,(z) pode ser representada por 


— 1 Z e o +z cos 0 2v 
I(z) = sans) I e sen^” 0 do 
1 A E v—1/2 
= — 5 +P (1 — p? d 
ama) LA 


E é à e 2v 
= lG) f cosh(z cos 0)sen*”8 do. 


11.5.5 Uma cavidade cilíndrica tem raio a e altura l, Figura 11.3. As extremidades, z = 0 e l estão em 
potencial zero. As paredes cilíndricas, p = a, têm um potencial V = V (y, 2). 


(a) Mostre que o potencial eletrostático &(p, >, z) tem a forma funcional 


D(p, 7,2 =y 5 Im(knp)sen knz - (amnsen my + bmn cos mo), 


em que kn = nr/l. 
(b) Mostre que os coeficientes &mn € bmn são dados por? 


27 
amn sen my 
Es J= FT a], fr (o, 2)sen kn 2 - i O Jaz dọ. 


Sugestão: Expanda V(y,z) como uma série dupla e use a ortogonalidade das funções 
trigonométricas. 


11.5.6 Verifique que K, (x) é dada por 


mI (a) -— I(x) 


2 sen VT 


K, (x) = 
e, a partir dessa expressão, mostre que 
K(x) = K- (x). 


11.5.7 Mostre que K, (x) satisfaz as relações de recorrência 


K,-a(x) e Kosi(x) = = Hola), 
K,-a(ax) + Ko (£) = —2Ki (x). 


11.5.8 Se K, = e”T'K,, mostre que K, satisfaz as mesmas relações de recorrência que T,. 


11.5.9 Parav > -4 mostre que K, (z) pode ser representada por 
1/2 V poo 
K,(z2)= aa É f e n tsenh”t dt, sa arg 2 < 
L2 0 2 


mu? daN [9 
o ao —2p(m2  qyv—l/2 
e 


22Quando m = 0, no coeficiente é substituído por 1. 
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11.5.10 


11.5.11 


11.5.12 


11.5.13 


11.5.14 


11.5.15 


11.5.16 


11.5.17 


Mostre que I, (x) e K, (x) satisfazem a relação wronskiana 


Il) Ki(x) — I, (2)K, (£) = =>. 


Esse resultado é citado na Seção 9.7 no desenvolvimento de uma função de Green. 


Se r = (x£? + y?)!/2, prove que 


r T 


Cad Je cos(xt)Ko(yt) dt. 


Essa é uma transformada de Fourier de co-seno de Ko. 


(a) Verifique que 
1 T 
To(x) = if cosh(x cos 0) do 
0 


T 
satisfaz a equação modificada de Bessel, v = 0. 

(b) Mostre que essa integral não contém nenhuma mistura de Ko(x), a segunda solução irregular. 

(c) Verifique o fator de normalização 1/7. 


Verifique que as representações integrais 


1 T 
In(z) = F e“ st cos(nt) dt, 
0 


T 


K, (z2) = f e osht cosh(vt) dt, R(z) >0, 


satisfazem a equação modificada de Bessel por substituição direta naquela equação. Como você 
pode mostrar que a primeira forma não contém uma mistura de K,, e que a segunda forma não 
contém uma mistura de 1,? Como você pode verificar a normalização? 


Derive a representação integral 


tj == f e” €58 cos(n0) do. 


T 


Sugestão: Comece com a representação integral correspondente de Jp(x). A Equação (11.120) é 
um caso especial dessa representação. 


Mostre que 
Ko(2) = I e? cosh t dt 
0 


satisfaz a equação modificada de Bessel. Como você pode determinar que essa forma é linearmente 
independente de To(2)? 


Mostre que 


e” = o(a)To(z) +25 In(a)Tnlz), — -I<a<l 


Tn (x) é o polinômio de Chebyshev de enésima ordem, Seção 13.3. 
Sugestão: Admita uma expansão de série de Chebyshev. Usando a ortogonalidade e normalização 
das Ta (x), resolva para os coeficientes da série de Chebyshev. 


(a) Escreve uma sub-rotina de precisão dupla para calcular T, (x) com precisão até a décima 
segunda casa decimal para n = 0,1,2,3,...e 0 < x < 1. Verifique seus resultados 
comparando-os com os valores de 10 casas decimais dados em AMS-55, Tabela 9.11, referência 
fornecida em Leituras Adicionais do Capítulo 8. 

(b) Com referência ao Exercício 11.5.16, calcule os coeficientes nas expansões de Chebyshev de 
cosh x e de senh z. 
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11.5.18 A cavidade cilíndrica do Exercício 11.5.5 tem um potencial ao longo das paredes do cilindro: 


1005, ESES 
Vig) = 
100(1- 2), 4<2<1. 


Sendo a razão raio/altura a/l = 0, 5, calcule o potencial para z/l = 0,1(0,1)0, 5 e p/a = 
0,0(0,2)1,0. 
Valor de verificação Para z/l = 0,3 e p/a = 0,8, V = 26,396. 


11.6 Expansões Assintóticas 

Em problemas físicos, muitas vezes é preciso saber como uma dada função de Bessel ou função modificada de 
Bessel se comporta para valores grandes do argumento, isto é, o comportamento assintótico. Essa é uma ocasião 
em que os computadores não ajudam muito. Uma possível abordagem é desenvolver uma solução de série de 
potências da equação diferencial, como na Seção 9.5, mas agora usando potências negativas. Esse é o método de 
Stokes, Exercício 11.6.5. A limitação é que, partindo de algum valor positivo do argumento (para convergência da 
série), nós não sabemos que mistura de soluções ou múltipla de uma dada solução temos. O problema é relacionar 
a série assintótica (útil para grandes valores da variável) com a série de potências ou definição relacionada (útil 
para valores pequenos da variável). Essa relação pode ser estabelecida introduzindo uma representação integral 
adequada e então usando ou o método de inclinações mais acentuadas, Seção 7.3, ou a expansão direta, como 
desenvolvida nesta Seção. 


Expansão de uma Representação Integral 
Como abordagem direta, considere a representação integral (Exercício 11.5.9) 


1/2 V po m 1 
K,(2)= a (5) f Ee y v>-s. (11.122) 
5 


Por enquanto, vamos admitir que z seja real, embora a Equação (11.122) possa ser estabelecida para — 7/2 < 
arg z < 7/2 (R(z) > 0). Temos três tarefas: 
1. Mostrar que K,, como dada na Equação (11.122), realmente satisfaz a equação modificada de Bessel (11.109). 
2. Mostrar que a solução regular I, está ausente. 
3. Mostrar que a Equação (11.122) tem a normalização adequada. 
1. O fato de a Equação (11.122) ser uma solução da equação modificada de Bessel pode ser verificado por 
substituição direta. Obtemos 
2 dq v+1/2 
v+1 E is 2r 20 1 d = 0 

26 [ eee e 
que transforma o integrando combinado na derivada de uma função que desaparece em ambas as extremidades. 
Por conseguinte, a integral é alguma combinação linear de I, e K,. 
2. A rejeição da possibilidade de que essa solução contém 1, constitui o Exercício 11.6.1. 
3. A normalização pode ser verificada mostrando que, no limite z — 0,K,(z) está de acordo com a 
equação (11.119). Substituindo z = 1 + t/z, 


1/2 V po 
E err (x? — e dz 
(v — 5)! 2 1 


O /z\” S: mo vo DE v=1/2 q 
E T fz\ Af E A a 11.123 
r) É f É (=+ ) Z a 
1/2 Ro so 2 v—1/2 
z o. eta E z) dt, (11.123b) 
EA] r 


excluindo t?/z? como fator. Essa substituição mudou os limites de integração para uma faixa mais conveniente 
e isolou a dependência exponencial negativa e77. A integral na Equação (11.123b) pode ser avaliada para z = O 
para resultar (2v — 1)!. Então, usando a fórmula de duplicação (Seção 8.4), temos 
— 1)!27-1 
lim K,(2) = Can od v>0, (11.124) 


2” 
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de acordo com a Equação (11.119) que, desse modo, verifica a normalização.? 
Agora, para desenvolver uma série assintótica para K,(z), podemos reescrever a Equação (11.123a) como 


T ef ea EPE 
Ki(z) = eum etehi) dt (11.125) 
3)! 0 2z 


(excluindo 2t/z como fator). 
Expandimos (1 + t/22)”—!/2 pelo teorema binomial para obter 


2 T ef < (v — 5)! —r Es —t v+r—1/2 
K) =y z; EA mao f et dt. (11.126) 


= 


Uma integração termo a termo (válida para série assintótica) apresenta como resultado a desejada expansão 
assintótica de K, (2): 


To, (402 12) (4? - 1) (4? — 32) 
Ko?) = ze [+ ma + MET | (11.127) 


Embora a integral da Equação (11.122), integrando ao longo do eixo real, fosse convergente só para —m/2 < 
argz < 1/2, a Equação (11.127) pode ser estendida para —37/2 < argz < 37/2. Considerada uma série 
infinita, a Equação (11.127) é, na verdade, divergente.” Contudo, essa série é assintótica, no sentido de que, 
para z suficientemente grande, K,(z) pode ser aproximada para qualquer grau fixo de precisão com um número 
pequeno de termos. (Compare com a Seção 5.10 para uma definição e discussão de série assintótica.) É conveniente 
reescrever a Equação (11.127) como 


Ko) = = [P (iz) + iQu(iz)], (11.128) 
em que 
Qu fo Ro (11.129) 
i p= av, 


Devemos observar que, embora P,(z) da Equação (11.129a) e Q.(z) da Equação (11.129b) 
tenham sinais alternantes, a série para P,(iz) e Qu(iz) da Equação (11.128) tem todos os sinais 
positivos. Por fim, para z grande, P, domina. 

Então, com a forma assintótica de K,(z), Equação (11.128), podemos obter expansões para todas as outras 
funções de Bessel e hiperbólicas de Bessel definindo relações: 


1. Por z 
zi HS (iz) = K, (2) (11.130) 
temos 
2 INT 
HD) = 4/2 IE EA 
s (2) V mz XP ilz v+s 5 
- [P(2) + iQL(2)]; —n < arg z < 2r. (11.131) 


2. A segunda função de Hankel é apenas o conjugado complexo da primeira (para argumento real), 


HPO = Zef ilz (+33 


- [Po(2) — iQ,(2)], —2r < arg z < T. (11.132) 


23Para v — 0, a integral diverge de forma logarítmica, de acordo com a divergência logarítmica de Ko (z) para z — O (Seção 11.5). 

24Nossa expansão binomial é válida somente para t < 2z e integramos t até o infinito. O decréscimo exponencial do integrando evita um 
desastre, mas a série resultante ainda é só assintótica, não convergente. Pela Tabela 9.3, z = oo é uma singularidade essencial das equações de 
Bessel (e modificadas de Bessel). O teorema de Fuchs não garante uma série convergente e não obtemos uma série convergente. 
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Uma derivação alternativa do comportamento assintótico das funções de Hankel aparece na Seção 7.3 como 
aplicação do método de inclinações mais acentuadas. 


3. Uma vez que J,(z) é a parte real de HO (2) para z real, 


J,(2)= = (rue) cos [- (v+ 5) a 


— Qu(z)sen E — ( + 5) zl i —T < arg z <T, (11.133) 


vale para z real, isto é, arg z = 0,7. Uma vez estabelecida a Equação (11.133) para z real, a relação é válida 
para z complexo na faixa de argumento dada. 


4. A função de Neumann é a parte imaginária de H, SD (z) para z real ou 


NZ) = Z {Posen E = (v+ z) z| 


+ Qula) cos|z- (1+5) an -T < aArgZ <T. (11.134) 


De início, essa relação é estabelecida para z real, mas pode ser estendida para o domínio complexo como 
mostrado. 
5. Por fim, a função hiperbólica ou modificada de Bessel 7, (z) é dada por 


dz) =i J, (iz) (11.135) 


ou 


L(2) = [P(iz)-iQ(i)], -Z < argz < 


3 (11.136) 


wla 


Isso conclui nossa determinação das expansões assintóticas. Contudo, talvez valha a pena observar as 
características primárias. À parte o onipresente 212, J, e N, se comportam como co-seno e seno, 
respectivamente. Os zeros são quase uniformemente espaçados em intervalos de 7; o espaçamento se torna 
exatamente m no limite, quando z — oo. As funções de Hankel foram definidas para se comportar como 
as exponenciais imaginárias e as funções modificadas de Bessel I, e K, entram nas exponenciais positivas e 
negativas. Esse comportamento assintótico pode ser suficiente para eliminar imediatamente uma dessas funções 
como solução para um problema físico. Devemos notar também que as séries assintóticas P,(z) e Q, (z), 
Equações (11.129a) e (11.129b), terminam em v = +1/2,+3/2,... e se tornam polinômios (em potências 
negativas de z). Para esses valores especiais de v as aproximações assintóticas se tornam soluções exatas. 

É interessante considerar a precisão das formas assintóticas, considerando apenas o primeiro termo, por exemplo 


(Figura 11.11), 
2 1 T 
Jale) = cosfa (r+ ) ( )| (11.137) 
TË 2 2 


Claramente, a condição para a validade da Equação (11.137) é que o termo de seno seja desprezível, isto é, 


8r > 4n? — 1. (11.138) 


Para n ou v > 1 a região assintótica pode estar muito distante. 
Como destacamos na Seção 11.3, as formas assintóticas podem ser usadas para avaliar as várias fórmulas 
wronskianas (compare com o Exercício 11.6.3). 


Exercícios 


11.6.1 Ao verificar a normalização da representação integral de K, (z) (Equação (11.122)), admitimos 
que J„(z) não estava presente. Como sabemos que a representação integral não resulta em 
K,(z) + el,(z) come £ 0? 


ELSEVIER 


“livro” — 2007/8/1 — 15:06 — page 547 — #557 


11. FUNÇÕES DE BESSEL 547 


11.6.2 


11.6.3 


11.6.4 


11.6.5 


—1,20 


“0,00 0,80 1,60 240 3,20 4,00 4,80 5,60 


Figura 11.11: Aproximação assintótica de Jo(a:). 


(a) Mostre que 
yZ] = 2” J e(t — T dt 
satisfaz a equação modificada de Bessel, contanto que o contorno seja escolhido de modo que 


e (1? == 1) v+1/2 


tenha o mesmo valor nos pontos inicial e final do contorno. 
(b) Verifique que os contornos mostrados na Figura 11.12 são adequados para esse problema. 


t plano 


Figura 11.12: Contornos da função modificada de Bessel. 


Use as expansões assintóticas para verificar as seguintes fórmulas wronskianas: 

(a) J(a)J- sola) + J-v(£)Jy41 (£) = —2sen vr /rz, 

(b) J(a)Nosa(a) — J41 (£) Nu (£) = —2/1a, 

©) J (2)HP (2) — J (2) HP (x) = 2/inz, 

(0 I (x)K,(2) — I (2)Ku (x) = —1/7x, 

(©) Ip (£)Kr41(£) + p41 (£)K (£) = 1/2. 

Pela forma assintótica de K,(z), Equação (11.127), derive a forma assintótica de H Wz), 
Equação (11.131). Note, em particular, a fase (v + 4)r/2. 

Método de Stokes. 


(a) Substitua a função de Bessel na equação de Bessel por x !/2y(a) e mostre que y(x) satisfaz 


2 


y! (£) + (1 a 3 Dota =0. 


(b) Desenvolva uma solução de série de potências com potências negativas de x começando com a 
forma admitida 


OO 
y(x) = e” 5 ant E 
n=0 
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Determine a relação de recorrência dando a, 1 em termos de an. Verifique seu resultado em 
comparação com a série assintótica, Equação (11.131). 
(c) Pelos resultados da Seção 7.4, determine o coeficiente inicial, ao. 


11.6.6 Calcule as 15 primeiras somas parciais de Po(x) e Qo(x), Equações (11.129a) e (11.129b). Faça 
x variar de 4 a 10 em etapas unitárias. Determine o número de termos que devem ser retidos para 
precisão máxima e a precisão conseguida como uma função de x. Especificamente, quão pequeno 
x pode ser sem elevar o erro acima de 3 x 107892 

Resposta: £mín = 6. 
11.6.7 (a) Usando as séries assintóticas (somas parciais) Po(x) e Qo(x) determinadas no Exercício 11.6.6, 
escreva um subprograma de função FCT(X) para calcular Jo(x), x real, para x > Zmín- 
(b) Teste sua função comparando-a com Jo(x) (tabelas ou sub-rotina de biblioteca de computador) 
para £ = £mín(10)£mín + 10. 
Nota: Uma forma assintótica mais precisa e talvez mais simples para Jo(x) é dada em AMS-55, 
Equação (9.4.3), referência fornecida em Leituras Adicionais do Capítulo 8. 


11.7 Funções Esféricas de Bessel 
Quando a equação de Helmholtz é separada em coordenadas esféricas, a equação radial tem a forma 


ËR dR 
ato [kr —n(n+1)]R=0. (11.139) 
Essa é a Equação (9.65) da Seção 9.3. O parâmetro k entra pela equação original de Helmholtz, enquanto n(n + 1) 
é uma constante de separação. Pelo comportamento da função angular polar (equação de Legendre, Seções 9.5 e 
12.5), a constante de separação deve ter essa forma, sendo n um inteiro não-negativo. A Equação (11.139) tem a 
virtude de ser auto-adjunta mas, claramente, não é a equação de Bessel. Contudo, se substituirmos 


— Z(kr) 
R(kr) = Er 
a Equação (11.139) se torna 
Z dZ No 
DnA REA 202. _— Ee — 
ra Err + É (r+ 5) |z 0, (11.140) 


que é a equação de Bessel. Z é uma função de Bessel de ordem n + 5 (sendo n inteiro). Por causa da importância 
de coordenadas esféricas, essa combinação, isto é, 


Zn+1/2 (kr) 
(kr)1/2 E 


ocorre com muita frequência. 
Definições 


E conveniente rotular essas funções como funções esféricas de Bessel com as seguintes equações definidoras: 


T 


jn(x) = zz 1n+1/2(2), 


(11.141) 


Essas funções esféricas de Bessel (Figuras 11.13 e 11.14) podem ser expressas em forma de série usando a série 
(Equação (11.5)) para Jn, substituindo n por n + 5: 
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> xX 


Figura 11.13: Funções esféricas de Bessel. 


Figura 11.14: Funções esféricas de Neumann. 
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oo (=1) m 2s+n+1/2 
Jn xz) = 11.142 
+1/2(2) er ( ) 
Usando a fórmula de duplicação de Legendre, 
az + d)l=2"2-1Iq1/2(22 + 1)!, (11.143) 
temos 
. e oo (=1)5225+2m+1(s + n)! A 2s+n+1/2 
Jale) = m3 T!/2(2s + 2n + 1)!s! (5) 
2 (-Ds(s+n)! 
=P Y AOUE h (11.144) 


Ze si(25 + 2n + 1)! 


Agora, Nn+1/2(£) = (~1)”™J_n—1/2(x) e pela Equação (11.5) constatamos que 


œœ —1)5 2s—n—1/2 
m Ss) (5) (11.145) 


I(s—-m— £ 
= s!(s fr 5) 


Isso resulta em 


E Pr! & (—1)* q 
na(s) = (=) l ) (11.146) 


n+1 llana enk 
x me s(s—n— 5)! 


A fórmula de duplicação de Legendre pode ser usada novamente para dar 


(11.147) 


ado Ra (2s — 2n)! 


(HA (DD (s= n)! os 
E ten. 
s=0 

Essas formas de série, Equações (11.144) e (11.147), são úteis de três maneiras: (1) valores limitadores à medida 

que x — 0, (2) representações de forma fechada para n = 0, e, como uma extensão disso, (3) uma indicação de 

que as funções esféricas de Bessel guardam uma estreita relação com o seno e o co-seno. 
Para o caso especial n = 0 encontramos, a partir da Equação (11.144), que 


jo(a) = 3 RT = E (11.148) 


fee (2s + 1)! z 


enquanto para no, Equação (11.147) resulta em 


no(a) = -—, (11.149) 


Pela definição das funções esféricas de Hankel (Equação (11.141)), 


1 e 
hP (x) = (sen q — icos x) = e 
1 A 
hP (x) = (sen q +icosag) = as (11.150) 


As Equações (11.148) e (11.149) sugerem expressar todas as funções esféricas de Bessel como combinações 
de seno e co-seno. As combinações adequadas podem ser desenvolvidas pelas soluções de série de potências, 
Equações (11.144) e (11.147), mas essa abordagem é desajeitada. Na verdade, as formas trigonométricas já estão 
disponíveis como a expansão assintótica da Seção 11.6. Pelas Equações (11.131) e (11.129a), 


T 
hO (x) = suan 


= (H E Prray2() + Quenpa(2))- (11.151) 


25Tsso é possível porque cos(n + t)r = 0, veja a Equação (11.60). 
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Agora Pa+1/2 € Qn+1/2 São polinômios. Isso significa que a Equação (11.151) é matematicamente exata, e não 
uma simples aproximação assintótica. Obtemos 


1 PRE dd te 2n + 25)! 
ha te) = z 3 s!(82)8 — = 
S — 2 27 E é Goa) 


Muitas vezes um fator (—i)” = (e-'7/2)" será combinado com o e’? para dar e(2-"7/2), Para z real, jn(2) É à 


parte real disso, nn(z) a parte imaginária e hP (z) o conjugado complexo. Especificamente, 


É 1 i 
EO a A 11.153 
1 (x) e z x2 , ( a) 
Dra al É 3 3% 
ho (1) =e (:-5-5). (11.153b) 
sena cost 
ji(a) == 22 Ee P , 
(11.154) 
. 3 1 3 
ja(x) = sen 1 cos g, 
r3? zr q? 
cosx seng 
li 2 x’ 
i (11.155) 
no(a) = — (= — ) cost — —sen x, 
x z 
e assim por diante. 
Valores Limitadores 
Para x < 1,”% Equações (11.144) e (11.147) resultam em 
27n! TA 
n(x) S a ; 11.1 
io) = ar” ntl Ea 
—1)”+! =n)! 
nn (z) x ( ) . ( n) gro 
2" (—2n)! 
2n)! 
= En)! na (On 1)lla "t, (11.157) 
2"n! 


A transformação de fatoriais nas expressões para n, (1) emprega o Exercício 8.1.3. Os valores limitadores das 
funções esféricas de Hankel surgem como in (x). 


Os valores assintóticos de în, Nn, hP e hP podem ser obtidos das formas assintóticas de Bessel, Seção 11.6. 
Encontramos 


1 
jnlx) ~ =sen (e z =), (11.158) 
z£ 2 
(x) À os Es (11.159) 
Nn(x zoss- h : 
ix i(x—nr/2) 
hD (a) ~ (i HE = 4º , (11.160a) 
HH T 


26A condição de que o segundo termo na série seja desprezível em comparação com o primeiro na verdade é x < 2[(2n + 2) (2n + 3)/ 
(n + 1)]1/? para jn (2). 
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—ig —i(ea—nn/2) 
h(a) v Ti iE l (11.160b) 


x x 


A condição para essas formas esféricas de Bessel é que x >> n(n + 1)/2. Por esses valores assintóticos vemos que 
jn(x) e nn(x) são adequados para a descrição de ondas esféricas estacionárias; no) (x) e RP (x) correspondem 
a ondas esféricas progressivas. Se a dependência do tempo para as ondas progressivas for considerada como 
e '“t, então no) (x) resulta em uma onda esférica progressiva de saída em RP (x) uma onda de entrada. A teoria 


da radiação em eletromagnetismo e a teoria da dispersão em Mecânica Quântica fornecem muitas aplicações. 


Relações de Recorrência 

As relações de recorrência para as quais nos voltamos agora nos dão um modo conveniente para desenvolver as 
funções esféricas de Bessel de ordem mais alta. Essas relações de recorrência podem ser derivadas da série, mas, 
assim como acontece com as funções modificadas de Bessel, é mais fácil substituir nas relações de recorrência 
conhecidas, (Equações (11.10) e (11.12)). Isso resulta em 


_ m+1 


fn-1(£) + fni (2) = E fala), (11.161) 
nfn-1(£)— (n+ Dfaa(a) = (2n + Dfi(a). (11.162) 
Rearranjando essas relações (ou substituindo nas Equações (11.15) e (11.17)), obtemos 
E E | = ao); (11.163) 
dx 
d rn =g” 11.164 
q e Ie) = 0" fue). (11.164) 


Aqui, fn pode representar jn, Nn, hP ou RP. 

As formas específicas, Equações (11.154) e (11.155), também podem ser obtidas imediatamente da 
Equação (11.164). 

Por indução matemática podemos estabelecer as fórmulas de Rayleigh 


jale) = cre (tE (ES), (11.165) 


a de zx 
n nf 1 d\N”/cosz 
Nnn (x) =—(—1)"x (25) ( = ). (11.166) 


(11.167) 


h(x) = (= 1)"a” G =) É (= ) , 


Ortogonalidade 
Podemos considerar a integral de ortogonalidade para as funções ordinárias de Bessel (Equações (11.49) e (11.50)), 
a a2 2 
/ J, (002) J, (2n) pdp = © [Jv+1(avp)]’ Spa (11.168) 
0 a a 2 
e substituir na expressão para jn para obter 
a 3 
. Ph. P a` p, 2 
J di (o£) di (na ) pdo= 5 [in+1(Onp)] pq- (11.169) 
0 a a 2 


Aqui, Anp € Ang SÃO raízes de jn. 

Isso representa ortogonalidade em relação às raízes das funções de Bessel. Uma ilustração desse tipo de 
ortogonalidade é dada no Exemplo 11.7.1, o problema de um partícula dentro de uma esfera. A Equação (11.169) 
garante ortogonalidade das funções de onda 5, (1) para n fixo. (Se n variar, o harmônico esférico acompanhante 
dará ortogonalidade.) 
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Exemplo 11.7.1 PARTÍCULA DENTRO DE UMA ESFERA 

Uma ilustração da utilização de funções esféricas de Bessel é dada pelo problema de uma partícula dentro de uma 
esfera de raio a, descrita pela Mecânica Quântica. A teoria quântica requer que a função de onda 1), que descreve 
nossa partícula, satisfaça 


2 
ey = Ey, (11.170) 
m 


e que as condições de contorno (1) Y(r < a) permaneçam finitas, (2) Y(a) = 0. Isso corresponde a um poço de 
potencial quadrado V = 0, r < a e V = œ, r > a. Aqui, À é a constante de Planck dividida por 27, m é a massa 
de nossa partícula e E é sua energia. Vamos determinar o valor mínimo da energia para o qual nossa equação de 
onda tem uma solução aceitável. A Equação (11.170) é a equação de Helmholtz com uma parte radial (compare 
com a Seção 9.3 para separação de variáveis): 


ËR 2dR 2 n(n+1) 
E tra + É SO |R=0, (11.171) 


com k? = 2mE/h2. Daí, pela Equação (11.139), com n = 0, 
R= Ajo(kr) + Bno(kr). 


Escolhemos o índice n = 0, para o momento angular orbital porque qualquer dependência angular elevaria a 
energia. A função esférica de Neumann é rejeitada por causa de seu comportamento divergente na origem. Para 
satisfazer a segunda condição de fronteira (para todos os ângulos), exigimos que 


vV2mE 
>=>——— q 


7 1=6; (11.172) 


ka 


em que a é uma raiz de jo, isto é, jo(a) = 0. Isso tem o efeito de limitar as energias permissíveis a um certo 
conjunto discreto ou, em outras palavras, a aplicação da condição de contorno (2) quantiza a energia E. O menor 
de todos os a é o primeiro zero de jo, 

a=T, 


2h? h? 
Emi = Sa Rn (11.173) 
o que significa que, para qualquer esfera finita, a energia da partícula terá uma energia positiva mínima ou energia 
de ponto zero. Essa é uma ilustração do princípio da incerteza de Heisenberg para Ap with Ar < a. 

Em Física do Estado Sólido, Astrofísica e outras áreas da Física, podemos querer saber quantas soluções 
diferentes (estados de energia) correspondem a energias menores ou iguais a alguma energia fixa Eo. Para um 
volume cúbico (Exercício 9.3.5), o problema é razoavelmente simples. O caso esférico, consideravelmente mais 
difícil, é destrinchado por R. H. Lambert, Am. J. Phys. 36: 417, 1.169 (1968). 

A relevante relação de ortogonalidade para j, (kr) pode ser derivada da integral dada no Exercício 11.7.23. E 


Uma outra forma, a ortogonalidade em relação aos índices, pode ser escrita como 


/ Im(L) nl) dz = 0, mn, m,n >Q. (11.174) 


—00 


Deixamos a prova para o Exercício 11.7.10. Se m = n (compare com o Exercício 11.7.11), temos 


= é 2 al T 
O) de= FT (11.175) 


Grande parte das aplicações físicas de funções ortogonais de Bessel e esféricas de Bessel envolvem ortogonalidade 
com raízes variáveis e um intervalo [0, a] e as Equações (11.168) e (11.169) e o Exercício 11.7.23 para autovalores 
de energia contínua. 

As funções esféricas de Bessel entrarão novamente em conexão com ondas esféricas, mas adiamos mais 
considerações até após a introdução das funções angulares correspondentes, as funções de Legendre. 
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Exercícios 


11.7.1 


11.7.2 


11.7.3 


11.7.4 


11.7.5 


11.7.6 


Mostre que, se 


nala) = Y E Nariyal), 
CDS E Jaala). 


Derive as formas trigonométricas polinomiais de jn (2) e nn (z). 
[n/2] 
. 1 nT (—1) (n + 2s)! 
e n (- E =) » (28) (22)2 (n — 25)! 


a ; nm, CRNA (—1) (n+ 25 + 1)! 
z CN (2s + D)(22)25(n — 25 — DV 


ento pon (1n 2s)! 
Nn(Z) T Rai cos (- + m) 3 25) (n E 25)! 


ela é automaticamente igual a 


[(n=1)/2] 
(—1)”+! nT (—1D)º(n + 258 + 1)! 
Da Ra 2 (2s + Di(22)25+(n — 28 — 1)! 


Use a representação integral de J, (x), 


1 eN” f v—1/2 
= e +ixp = 2 
140) = saia) Je (1 p°) dp, 


para mostrar que as funções esféricas de Bessel jp (x) podem ser expressas em termos de funções 
trigonométricas, isto é, por exemplo, 


sen x ; sen x cos x 


ilo=E, am-E 


(a) Derive as relações de recorrência 


fail) + faal) = E pulo) 


nfn-(a) — (n + D fuga (x) = (2n + D fo (x) 
satisfeitas pelas funções esféricas de Bessel jn(x), nn(x), hP (x) e hP (x). 
(b) Por essas duas relações de recorrência, mostre que a função esférica de Bessel f(x) satisfaz a 
equação diferencial 


x’ f(x) +2xfi(x) + EA — m(n + D] fala) = (0. 


Prove por indução matemática que 


para n inteiro arbitrário não-negativo. 


Pela discussão da ortogonalidade das funções esféricas de Bessel, mostre que uma relação 
wronskiana para jn(x) e na(x) é 


i 1 


Jn (e)na (E) — nal) = zz- 


270 limite superior sobre o somatório [n /2] significa o maior inteiro que não excede n/2. 
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11.7.7 Verifique 

$ + 2i 
(1) (2) — AD) Blr- 
11.7.8 Verifique a representação integral de Poisson da função esférica de Bessel, 
. o 7” IES ; 2n+1 
In(Z) = DA cos(z cos 0)sen 0 do. 
11.7.9 Mostre que 
a de 2 sen[(u — v)n/2] 
I Jula)Ju(a) EO qu * u+v>-l. 
11.7.10 Derive a Equação (11.174): 
ii : mn 
Eo dica 
11.7.11 Derive a Equação (11.175): 
oo 9 x 
İn dr = —. 
OLES 
11.7.12 Estabeleça a integral de ortogonalidade para jz (kr) dentro de uma esfera de raio R com a condição 
de contorno 
jL(kR)=0. 
O resultado é usado na classificação de radiação eletromagnética conforme seu momento angular. 
11.7.13 As integrais de Fresnel (Figura 11.15 e Exercício 5.10.2) que ocorrem na teoria da difração são 


dadas por 


A 
1,0 E x 


| 
Si 
nj— 
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Mostre que essas integrais podem ser expandidas em séries de funções esféricas de Bessel 
1 f° — 
a(s) = 3 / ja(uul? du = s!/2 Au dan(s), 
1 f° — 
ye) = 3 |, ludu = s 2 
Sugestão: Para estabelecer a igualdade entre a integral e o somatório, talvez fosse melhor você 
trabalhar com suas derivadas. As esféricas de Bessel análogas das Equações (11.12) e (11.14) podem 
ajudar. 

11.7.14 Uma esfera oca de raio a (ressonador de Helmholtz) contém ondas sonoras estacionárias. Ache a 
freqüência mínima de oscilação em termos do raio a e da velocidade do som v. As ondas sonoras 
satisfazem a equação de onda 

1 02) 
V?y = >> 
Y y2 Ot? 
e a condição de contorno 
o 
= =0, r=a. 
Essa é uma condição de contorno de Neumann. O Exemplo 11.7.1 tem a mesma EDP, mas com uma 
condição de contorno de Dirichlet. 
Resposta: Vmín = 0, 3313v/a, Amáx = 3, 018a. 
11.7.15 Definindo as funções esféricas modificadas de Bessel (Figura 11.16) por 


Figura 11.16: Funções esféricas modificadas de Bessel. 


. [2 
in(x) = zz ln+/2(0), kn(x) = mg en /2(m), 
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mostre que 
; senh x e” 
tola) = kolz) = —. 
( ) x , o( ) E 


11.7.16 


11.7.17 


11.7.18 


11.7.19 


11.7.20 


11.7.21 


11.7.22 


Note que os fatores numéricos nas definições in e kn não são idênticos. 
(a) Mostre que a paridade de in (x) é (— 1)”. 
(b) Mostre que k, (x) não tem nenhuma paridade definida. 


Mostre que as funções esféricas modificadas de Bessel satisfazem as seguintes relações: 
(a)  in(£) =P ôn(ia), 
kala) = "AD (ix), 


b) inyi) = qr (o) , 


da 
knsi(Z) E ar É (4h) 
da i 
1 d \” senh 
(c) ma) =ar (2E) sen. A 
a da a 
1 dN\”e 
kn = 1 Nan Ea 
Mostre que as relações de recorrência para in (x) e kn(x:) são 
2n+1. 
(a) in—1(x) F Cad) = e in(x), 
2n+1 
(b) kn-i(x) — knsi(x) = — kn(x), 


nha (x) + (n+ Dknsi(x) = — (2n + Dki(a). 
Derive os valores limitadores para as funções esféricas modificadas de Bessel 


Oise tl) a, a< 
(b) in(x) ~ e, knlz) ~ el, > an(n + 1). 
Mostre que o wronskiano das funções esféricas modificadas de Bessel é dado por 


1 
in(2)kn (4) — in (x) kn(a) = ——5. 
z 
Uma partícula quântica de massa M está presa em um poço “quadrado” de raio a. A equação de 
potencial de Schrödinger é 
-= < 
ve)=f Vo O<r<a 


0, r>a. 
A energia da partícula, E, é negativa (um autovalor). 


(a) Mostre que a parte radial da função de onda é dada por jı(kır) para 0 < r < ae ki(kor) 
para r > a. (Exigimos que 1(0) seja finita e y(00) — 0.) Aqui, k? = 2M(E + Vo) /h2,k2 = 
—2M E /ħ? e | é o momento angular (n na Equação (11.139)). 

(b) A condição de contorno em r = a que a função de onda y(r) e sua derivada de primeira ordem 
sejam contínuas. Mostre que isso significa 


(d/dr)ji(kır) (d/dr)ki(kər) 


jk) rä kılkor) Rede 
Essa equação determina os autovalores da energia. 
Nota: Essa é uma generalização do Exemplo 10.1.2. 


A função de onda radial da Mecânica Quântica para uma onda espalhada é dada por 


— sen(kr + ôo) 
k— kr , 
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11.7.23 


11.7.24 


11.7.25 


11.7.26 


em que k é o número de onda, k = ,/2mE/h, e do é o deslocamento da fase do espalhamento. 
Mostre que a integral de normalização é 


l Prlripylr)r? dr = ap (6 — k’). 


Sugestão: Você pode usar uma representação de seno da função delta de Dirac. Veja o 
Exercício 15.3.8. 


Derive a releção de fechamento da função esférica de Bessel. 


2a? [O 


T Jo 


jnlar)jn(br)r? dr = ô(a — b). 


Nota: Uma interessante derivação envolvendo transformadas de Fourier, a expansão de onda plana 
de Rayleigh e harmônicos esféricos é dada por P. Ugincius, Am. J. Phys. 40: 1690 (1972). 


(a) Escreva uma sub-rotina para gerar as funções esféricas de Bessel, jn(x), isto é, para gerar o 
valor numérico de jn (x) dados x e n. 
Nota: Uma possibilidade é usar as formas explícitas conhecidas de jo e jı e desenvolver o 
índice mais alto, jn, por aplicação repetida da relação de recorrência. 

(b) Verifique sua sub-rotina por um cálculo independente, tal como a Equação (11.154). Se 
possível, compare o tempo de máquina necessário para essa verificação com o tempo requerido 
por sua sub-rotina. 


A função de onda de uma partícula dentro de uma esfera (Exemplo 11.7.1) com momento angular | é 
plr, 0, p) = Aj((V2ME)r/h)Y (0,9). O Y;™ (0, p) é um harmônico esférico, descrito na Seção 
12.6. Pela condição de contorno 1)(a, 0, p) = 0 ou j((V2ME)a/h) = 0, calcule os 10 estados 
de energia mais baixos. Despreze a degenerescência m (2l + 1 valores de m para cada escolha de 
l). Verifique seus resultados comparando-os com AMS-55, Tabela 10.6, referência fornecida em 
Leituras Adicionais do Capítulo 8. 

Sugestão: Você pode usar sua sub-rotina de esférica de Bessel e uma sub-rotina de busca de raízes. 


Valor de verificação jı(ais) = 0, 
Q01 = 3, 1416 
Q11 = 4, 4934 
Q21 = 5, 7635 
Qj = 6, 2832. 


Modifique o Exemplo 11.7.1 de modo que o potencial seja um Vo fora de (r > a). 
(a) Para E < Vo, mostre que 


ni 
DrscalTs 0, p) dá ki (G V 2M (Vo z FJ) E 
(b) As novas condições de contorno a satisfazer em r = a são 
Vaentro(% 0, p) T Vrora(, 0, p), 
à buentrolas8,8) = Č trora la, 0, 9) 
ðr dentro 0; P) = ðr fora 4: 9, P 


ou 


1 3Ydentro Es 1 OU tora 
dentro or r=a Prora Or 


Para | = 0 mostre que a condição de fronteira em r = a leva a 


1 1 
f(E) = Elfo ka — = eua + 3 =0, 


em que k = V2ME/ħe k' = /2M(Vo — E)/h. 


r=a 


ELSEVIER 
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(c) Com a = 4re9h2/M e? (raio de Bohr) e Vo = 4Me!/2h2, calcule os possíveis estados ligados 
(0 < E< v). 
Sugestão: Chame uma sub-rotina de busca de raízes após saber a localização aproximada das 


raízes de 
J(E)=0 (0< E< VW). 


(d) Mostre que, quando a = 4rcoh2/Me?, o valor mínimo de Vo para o qual existe um estado 
ligado é Vo = 2, 4674M et /2R?. 

Em algumas reações de desnudamento nuclear, a seção de choque diferencial é proporcional 
a jı(x)?, em que l é o momento angular. A localização do máximo sobre a curva de dados 
experimentais permite uma determinação de l, se a localização do (primeiro) máximo de j;(x:) 
for conhecida. Calcule a localização do primeiro máximo de j (x), ja(x:) e ja(x). 

Nota: Para melhor precisão, procure o primeiro zero de j; (x). Por que isso é mais preciso do que a 
localização direta do máximo? 


Leituras Adicionais 
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Watson, G. N., A Treatise on the Theory of Bessel Functions, 2& ed. Cambridge, UK: Cambridge University Press 
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Funções de Legendre 


12.1 Função Geratriz 


Polinômios de Legendre aparecem em muitas situações físicas e matemáticas diferentes. (1) Podem se originar 
como soluções da EDO de Legendre que já encontramos em separação de variáveis (Seção 9.3) para a equação 
de Laplace, a equação de Helmholtz e EDOs similares em coordenadas polares esféricas. (2) Entram como uma 
consegiiência de uma fórmula de Rodrigues (Seção 12.4). (3) Surgem como uma conseqiiência do requisito de um 
conjunto de funções completo, ortogonal, no intervalo [—1, 1] (ortogonalização de Gram-Schmidt, Seção 10.3). (4) 
Na Mecânica Quântica eles (na realidade, os harmônicos esféricos, Seções 12.6 e 12.7) representam autofunções 
de momento angular. (5) São gerados por uma função geradora. Aqui, introduzimos polinômios de Legendre por 
meio de uma função geradora. 


Base Física — Eletrostática 

Assim como em funções de Bessel, é conveniente introduzir os polinômios de Legendre por meio de uma função 
geradora que, aqui, aparece em um contexto físico. Considere uma carga elétrica q colocada sobre o eixo z em 
z = a. Como mostra a Figura 12.1, o potencial eletrostático da carga q é 


1 
= . (unidades SI). (12.1) 
41€e0 Ti 


p 


Queremos expressar o potencial eletrostático em termos de coordenadas polares esféricas r e 0 (a coordenada y 
está ausente por causa da simetria em torno do eixo z). Usando a lei dos co-senos na Figura 12.1, obtemos 


“4 
ATEQ 


p (r? +a? — 2ar cos 0)". (12.2) 


> 2 


Figura 12.1: Potencial eletrostático. Carga q afastada da origem. 


Polinômios de Legendre 

Considere o caso de r > a ou, mais precisamente, r? > |a? — 2ar cos 0|. O radical na Equação (12.2) pode ser 
expandido em uma série binomial e então rearranjado em potências de (a/r). O polinômio de Legendre P, (cos 0) 
(veja a Figura 12.2) é definido como o coeficiente da enésima potência em 


-a S ENO 
o= gez Pulcoso)(2) : (12.3) 


=0 
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Pœ) 


Figura 12.2: Polinômios de Legendre P(x), P(x), P4(x) e P;(x). 


Descartando o fator q/4r£or e usando z e t em vez de cos 0 e a/r, respectivamente, temos 


a(ba)=(1-20t+0) P=S Pa, el <1. (12.4) 
n=0 


A Equação (12.4) é a nossa fórmula de função geradora. Na próxima seção mostramos que |P, (cos 0)| < 1, o que 
significa que a expansão de série (Equação (12.4)) é convergente para |t| < 1.! De fato, a série é convergente para 
[t| = 1, exceto para |x| = 1. 

Em aplicações físicas a Equação (12.4) muitas vezes aparece na forma vetorial (veja a Seção 9.7) 


: l D) P, (cos 0), (12.4a) 


lr = rə] r> a 


Zo \"> 
em que 
"> T [rı] , paraļrı| > |r2l, (12.4b) 
r< = |r2| 
e 
r> F fra | para |rə| > |ri|. (12.4c) 
r< = ri] 


Usando o teorema binomial (Seção 5.6) e o Exercício 8.1.15, expandimos a função geradora como (compare 
com a Equação (12.33)) 


oy—1/2 E (2n)! 2N 
E +)” =) ppl’) 
IT Co Car- P)". (12.5) 


Para os primeiros polinômios de Legendre, digamos, Po, Pı e P2, precisamos dos coeficientes de t?, t! e t2. Essas 
potências de t aparecem somente nos termos n = 0, 1 e 2, e, por conseguinte, podemos limitar nossa atenção aos 


Note que a série na Equação (12.3) é convergente para r > a, ainda que a expansão binomial envolvida seja válida somente para 
r>(a2+2ar)!2 e cos0 = —1 our > a(1 + v2). 
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três primeiros termos da série infinita: 


| 
tra (mB) É E 


20(01)2 22(11)2 24(21)2 
3 1 
= + rt! + (Ge — 5)? +o(t). 


Então, pela Equação (12.4) (e unicidade da série de potências), 


3, 1 
Poa) =1, Pix) = x, P(x) = 5º T 
Mais adiante nesta seção, repetiremos esse desenvolvimento limitado em uma estrutura vetorial. 
Empregando um tratamento geral, constatamos que a expansão binomial do fator (2xt — t2)” resulta na série 
dupla 


= a E q (12.6) 


(ad 27 = ep! 2h Do k)! (2 t" 
k=0 


Pela Equação (5.64) da Seção 5.4 (rearranjando a ordem do somatório), a Equação (12.6) se torna 


oo [n/2] 


2\—1/2 = k (2n — 2k)! . n—2ksn 
(1- 20t+t?) = Al 1) Ehin Olla 2) (2x) Ft", (12.7) 


com o t” independente do índice k.? Agora, igualando nossas duas séries de potências (Equações (12.4) e (12.7)) 
termo a termo, temos” 


2n — 2k)! < 
Pala) = 2 DT = e m E (ae) 
k=0 


Por conseguinte, para n par, P, tem somente potências pares de x e paridade par (veja a Equação (12.37)) e 
potências ímpares e paridade ímpar para n ímpar. 


Multipolos Elétricos Lineares 
Voltando à carga elétrica sobre o eixo z, demonstramos a utilidade e poder da função geradora acrescentando uma 


carga —q em z = —a, como mostra a Figura 12.3. O potencial se torna 
q 1 1 
p= ( -—), (12.9) 
ÅTE0 rı r2 
q 1 1 
t S ATEo (x +) 
ra 
A 
ti 
-4 9 q i 
2=-a 2=q q 


Figura 12.3: Dipolo elétrico. 


2?[n/2] = n/2, para n par, (n — 1)/2, para n ímpar. 
3A Equação (12.8) começa com x”. Trocando o índice, podemos transformá-la em uma série que começa com xº para n par e x! para n 


ímpar. Essas séries ascendentes são dadas como funções hipergeométricas nas Equações (13.138) e (13.139), Seção 13.4. 
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e, usando a lei dos co-senos, temos 


E [amos (6) ] 
— [+2(5) cos 0 + ATR (r >a). 


Claramente, o segundo radical é como o primeiro, exceto que a foi substituído por —a. Então, usando a 
Equação (12.4), obtemos 


na Da 


> ru cosa) (o je -Era (coso (E 7 


tona) sado e (12.10) 


O primeiro termo (e termo dominante para r >> a) é 


e 


_ 2ag Pi(cos0) 
= +, 


12.11 
4reo r ( ) 


que é o potencial do dipolo elétrico, e 2aq é o momento do dipolo (Figura 12.3). Essa análise pode ser estendida 
colocando cargas adicionais sobre o eixo z e de modo que o termo P}, assim como o termo Po (monopolo), seja 
cancelado. Por exemplo, cargas de q e z = a e z = —a, —2q em z = 0 dão origem a um potencial cuja expansão de 
série começa com Po (cos 8). Isso é um quadrupolo elétrico linear. Pode-se posicionar dois quadrupolos de modo 
que o termo do quadrupolo seja cancelado, mas P3, o termo do octopolo, sobrevive. 


Expansão Vetorial 
Consideramos o potencial eletrostático produzido por uma carga distribuída p(r2): 


olrı) -JE (12.12a) 
— Areo Ira a ue 


Essa expressão já apareceu nas Seções 1.16 e 9.7. Considerando o denominador do integrando, usando primeiro a 
lei dos co-senos e em seguida uma expansão binomial, temos como resultado (veja a Figura 1.42) 


1 -1/2 


= (r? — 2rı -r2 + r2) (12.12b) 
[ri — rə] 
1 2 2 —1/2 
-+h ( asa | : for rı > r2 
rı ri ri 
1 Pit Fà 1r 3 (rı r2)? Ta 3 
z l+t— 2 4 -O 
rı rí 2ri 2 rî rı 
(Parar; = 1, r2 = t e rı : r2 = xt, a Equação (12.12b) se reduz à função geradora, Equação (12.4).) 
O primeiro termo dentro dos colchetes, 1, dá um potencial 
e) = — 4 [otra (12.120) 
rı) = — — r ro. .12c 
Por aneor Pla 2 
A integral é exatamente a carga total. Essa parte do potencial total é um monopolo. 
O segundo termo resulta em 
1 ri: 3 
pı(rı) = TE / rop(ra) dºro, (12.12d) 


em que a integral é o momento do dipolo cuja densidade de carga p(r>) é ponderada por um braço de momento 
r2. Temos um potencial de dipolo elétrico. Para estados atômicos ou nucleares de paridade definida, p(r>) é uma 
função par e a integral do dipolo é identicamente zero. 
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Os últimos dois termos, ambos de ordem (rs / r1)’, podem ser manipulados usando coordenadas cartesianas: 


3 3 
2r 
(rı -r2) = ) Tiiti ) TijT2j- 
i=1 j=1 
Rearranjando variáveis para pegar as componentes x, fora da integral, temos como resultado 


3 

Po(r1) = RE a Tiitij / Bazixoj = ôi;r2] p(r2) dra. (12.12e) 

e 

Esse é o termo do quadrupolo elétrico. Notamos que os colchetes no integrando forma um tensor simétrico de 

traço nulo. 

Também se pode desenvolver uma expansão multipolar eletrostática geral usando a Equação (12.12a) para o 
potencial (r1) e substituindo 1/(4r|rı — r2|) pela função de Green, Equação (9.187). Isso resulta no potencial 
(r1) como uma série (dupla) dos harmônicos esféricos Y,” (01, p1) e Y” (02, p2). 

Antes de deixarmos os campos multipolares, talvez seja interessante destacar três pontos: 

e Primeiro, um multipolo elétrico (ou magnético) é isolado e bem definido somente se todos os multipolos de 
ordem mais baixa desaparecerem. Por exemplo, o potencial de uma carga q em z = a foi expandido em uma 
série de polinômios de Legendre. Embora nessa expansão nos refiramos ao termo P, (cos 0) como um termo de 
dipolo, devemos lembrar que esse termo existe somente por causa das coordenadas que escolhemos. Também 
temos um monopolo, Po(cos 0). 

e Segundo, em sistemas físicos não encontramos multipolos puros. Como exemplo, o potencial do dipolo finito (q 
em z = a, —q em z = —a) continha um termo Ps(cos 8). Esses termos de ordem mais alta podem ser eliminados 
encolhendo o multipolo até um multipolo pontual, nesse caso mantendo o produto ga constante (a — 0, q — 00) 
para manter o mesmo momento de dipolo. 

e Terceiro, a teoria de multípolo não está restrita a fenômenos elétricos. Configurações planetárias são descritas 
em termos de multipolos de massa, Seções 12.3 e 12.6. A radiação gravitacional depende do comportamento 
de quadrupolos de massa em relação ao tempo. (O campo de radiação gravitacional é um campo tensorial. A 
radiação quântica, grávitons, carrega duas unidades de momento angular.) 


Também poderíamos observar que uma expansão de multipolo é, na verdade, uma decomposição nas 
representações irredutíveis do grupo de rotação (Seção 4.2). 


Extensão para Polinômios Ultra-Esféricos 
A função geradora usada aqui, g(t, £), é, na realidade, um caso especial de uma função geradora mais geral, 


1 
— (a) n 
(E pro (a)t”. (12.13) 


Os coeficientes CÃO (x) são os polinômios ultra-esféricos (proporcionais aos polinômios de Gegenbauer). Para 
a = 1/2, essa equação se reduz à Equação (12.4); isto é, COP (a) = Pa(x). Os casos a = 0 ea = 1 são 
considerados no Capítulo 13 em conexão com os polinômios de Chebyshev. 


Exercícios 


12.1.1 Desenvolva o potencial eletrostático para o arranjo de cargas a seguir, que representa um quadrupolo 
elétrico linear (Figura 12.4). 


12.1.2 Calcule o potencial eletrostático do arranjo de cargas mostrado na Figura 12.5. Aqui temos um 
exemplo de dois dipolos iguais mas em direções opostas. As contribuições do dipolo se cancelam. 
Os termos do octopolo não se cancelam. 


12.1.3 Mostre que o potencial eletrostático produzido por uma carga q em z = a parar < a é 


g(r) = E 2 (=) “Pu(cos6). 


n= 
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Figura 12.4: Quadrupolo elétrico linear. 


-q +2q -2q q 
e e O e e > Z 
z=-2a —a a 2a 


Figura 12.5: Octopolo elétrico linear. 


12.1.4 Usando E = — V ọ, determine as componentes do campo elétrico correspondente ao potencial de 
dipolo elétrico (puro) 
2aqP; (cos 0) 
pe Areor? ` 
Aqui, admitimos que r > a. 
Resposta: E, = go Ego = geo E, =0. 
ý Arer? ’ 4rneor3? — ® 


12.1.5 Um dipolo elétrico pontual de intensidade p() é colocado em z = a; um segundo dipolo elétrico 
pontual de intensidade igual, porém contrária, está na origem. Mantendo o produto p(™a constante, 
deixe a — 0. Mostre que isso resulta em um quadrupolo elétrico pontual. 

Sugestão: O Exercício 12.2.5 (quando provado) será útil. 


12.1.6 Uma carga pontual q está no interior de uma esfera condutora oca de raio ro. A carga q é deslocada 
a uma distância a do centro da esfera. Se a esfera condutora for aterrada, mostre que o potencial 
no interior produzido por q e a carga induzida distribuída é a mesma que a produzida por q e sua 
carga imagem q”. A carga imagem está à distância a” = r2/a do centro, colinear com q e a origem 
(Figura 12.6). 


e > 2 


a — 


Figura 12.6: Esquema para o cálculo do potencial elétrico de uma esfera oca condutora aterrada utilizando-se o método das imagens. 


Sugestão: Calcule o potencial eletrostático para a < ro < a”. Mostre que o potencial se anula para 
r = ro se considerarmos q' = —gro/a. 


12.1.7 Prove que 
n+1 o” 1 
Palcos 6) = (—1)” ( J 


n! Oz" Ar 


Sugestão: Compare a expansão de polinômios de Legendre da função geradora (a — Az, Figura 
12.1) com uma expansão de série de Taylor de 1/r, em que a dependência de z de r muda de z para 
z — Az (Figura 12.7). 
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Figura 12.7: 


12.1.8 Por diferenciação e substituição direta da forma de série, Equação (12.8), mostre que P,(x) 
satisfaz a EDO de Legendre. Note que não há nenhuma restrição sobre x. Podemos ter qualquer 
Z,—00 < x < œ% e, na verdade, qualquer z em todo o plano complexo finito. 


12.1.9 Os polinômios de Chebyshev (tipo II) são gerados (Equação (13.93), Seção 13.3) 


ra = 3 tule 


Usando as técnicas da Seção 5.4 para séries transformadoras, desenvolva uma representação de série 


de Un (x). 
[n/2] 
Resposta: Un (£) = e O ra e, 
k=0 i ; 


12.2 Relações de Recorrência e Propriedades Especiais 
Relações de Recorrência 
A função geradora de polinômios de Legendre oferece um modo conveniente para derivar relações de recorrência 


e algumas propriedades especiais. Se nossa função geradora (Equação (12.4)) for diferenciada com relação a t, 
obtemos 


4 


Og(t, x) T—t n— 1 
X U n AA = nao Jt (12.14) 


Substituindo a Equação (12.4) nessa expressão e rearranjando termos, temos 


(1-2rt +t?) nba eE + (t — x) XC Plot =0. (12.15) 
n=0 


O lado esquerdo é uma série de potências em t. Uma vez que essa série de potências se anula para todos os valores 
de t, o coeficiente de cada potência de t é igual a zero, isto é, nossa série de potências é única (Seção 5.7). Esses 
coeficientes são encontrados separando os somatórios individuais e usando índices de somatório distintos: 


3 mBa(eto* — 5 2nxP,(a)t” + > Eae A 
n=0 
+ 3 Po(ajttt — 3 xP, (x)t” = 0. (12.16) 
n=0 


Agora, fazendo m = n + 1, s = n — 1, encontramos 
(2n + 1) P(x) = (n + 1)Pap1 (£) + nPn-1(2), m= ASi (12.17) 


Essa é outra relação de recorrência de três termos similar (mas não idêntica) à relação de recorrência para funções 
de Bessel. Com essa relação de recorrência podemos construir com facilidade os polinômios de Legendre de ordem 


4Também podemos aplicar diretamente a forma de série explícita da Equação (12.8). 
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mais alta. Se considerarmos n = 1 e inserirmos os valores fáceis de achar de Po(x) e Pi(x) (Exercício 12.1.7 ou 
Equação (12.8)), obtemos 


32Pi(a) = 2P5(x) + Po(x), (12.18) 
ou 


Po(x) = = (3x? — 1). (12.19) 


Nj = 


Esse processo pode ser continuado indefinidamente, e alguns dos primeiros polinômios de Legendre estão 
relacionados na Tabela 12.1. 


Tabela 12.1 Polinômios de Legendre 


Po(a)=1 

Pi(a)=a 

P(x) = > (3x? —1) 

P(x) = i(5x3 — 3x) 

Pula) a (354 — 3072 + 3) 

Ps(x) = 5 (631º — 707º + 152) 

P(x) = se (23128 — 315xº + 105x? — 5) 

P(x) = $ (429x17 — 693x + 315x — 35x) 

P(x) = 155 (643518 — 12012x + 69307! — 1260x? + 35) 


Por mais que essa técnica a princípio possa parecer incômoda, na verdade ela é mais eficiente para um 
computador digital do que a avaliação direta da série (Equação (12.8)). Para maior estabilidade (a fim de evitar 
acúmulo e aumento indevidos do erro de arredondamento), a Equação (12.17) é reescrita como 


1 


Prt(a) = 20Pa(2) — Palo) — 


[2Pa(a) — Pala). (12.173) 


Começamos com Po(x) = 1, Pi(x) = x, e calculamos os valores numéricos de todos os P, (x) para um dado 
valor de x até o valor desejado Pw (1). Os valores de P.(x),0 < n < N, estão disponíveis como um benefício 
adicional. 


Equações Diferenciais 
Podemos obter mais informações sobre os polinômios de Legendre se agora diferenciarmos a Equação (12.4) em 
relação a x. Isso resulta em 


dg(t a) t LD oram 
dr (1 — 2gt + t2)3/2 TA Rek , (12.20) 
ou 
(1 — dat + a > P! (x)t” — >; Pala)” = 0. (12.21) 
n=0 n=0 


Como antes, o coeficiente de cada potência de t é igualado a zero e obtemos 
Puto) + Pp-1(£) = 22 P} (0) + Elo): (12.22) 


Podemos encontrar uma relação mais útil diferenciando a Equação (12.17) com relação a x e multiplicando por 
2. A isso adicionamos (2n + 1) vezes a Equação (12.22), cancelando o termo P’ . O resultado é 


Pala) — Pia) = (2n + 1)P (£). (12.23) 
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Numerosas equações adicionais? podem ser desenvolvidas pelas Equações (12.22) e (12.23), incluindo 


Pile) = (n + 1) Palo) + £P; (£), (12.24) 
P] —1(2) = nP, (£) + £P;(2), (12.25) 
(1 = 2?) Pi (£) = nPa-1(£) — ne Pa (x), (12.26) 
(1 = 2?) Pi (£) = (n + DxPa(a) — (n + 1)Pap1 (2). (12.27) 


Diferenciando a Equação (12.26) e usando a Equação (12.25) para eliminar P’_; (x), constatamos que P,(x) 
satisfaz a EDO linear de segunda ordem 


(1 — x°) P! (x) — 22Pi (x) + n(n + 1)Pa(x) = 0. (12.28) 


As equações anteriores, Equações (12.22) a (12.27), são todas EDOs de primeira ordem, porém com polinômios 
com dois índices diferentes. O preço para ter todos os índices iguais é uma equação diferencial de segunda ordem. A 
Equação (12.28) é uma EDO de Legendre. Agora vemos que os polinômios P, (x) gerados pela série de potências 
para (1 — 2xt + [A 2 satisfazem a equação de Legendre, o que, é claro, é a razão por que eles são denominados 
polinômios de Legendre. 

Na Equação (12.28) a diferenciação é em relação a x (x = cos 6). Fregiientemente, encontramos a equação de 
Legendre expressa em termos de diferenciação com relação a 6: 


1 >( n gf) 


sen 0 dð do ) +n(n + 1)Pa(cos 0) = 0. (12.29) 


Valores Especiais 
Nossa função geradora nos dá ainda mais informações sobre os polinômios de Legendre. Se fizermos x = 1,a 
Equação (12.4) se torna 


1 1 Ee 
— — Pd 12.30 
(1-2+8)1/2 1-t > É ( ) 


usando uma expansão binomial ou a série geométrica, Exemplo 5.1.1. Mas a Equação (12.4), para x = 1, define 


1 So , 
Q242 T > Pai . 


Comparando as duas expansões de série (unicidade da série de potências, Seção 5.7), temos 
P,a (1) =1. (12.31) 


Se fizermos x = —1 na Equação (12.4) e usarmos 


1 1 


(1+2t+t)/2 1+t 


isso mostra que 
Pa(—1) =(—1)”. (12.32) 


Para obter esses resultados, constatamos que a função geradora é mais conveniente do que a forma de série 
explícita, Equação (12.8). 


*Usando o número da equação entre parênteses para denotar o lado esquerdo da equação, podemos escrever as derivadas como 
2. £ (12.17) + (2n + 1) - (12.22) > (12.23), 

4{(12.22) + (12.23)} > (12.24), 

5 ((12.22) — (12.23)} = (12.25), 

(12.28) n>n-1 + z - (12.25) > (12.26), 

& (12.26) + n- (12.25) > (12.28). 


> 
> 
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Se considerarmos x = () na Equação (12.4), usando a expansão binomial 


E CR NR O ESC tao 
(+t) =1 u E +(-1) A ppr (12.33) 
temosé 
1:3:--(2n—1) (Qn- 1)! (-D"(2n)! 
P =(" =(-9" z= 12.34 
Pən+1(0) = 0, n=0,1,2.... (12.35) 


Esses resultados também são obtidos da Equação (12.8) por inspeção. 


Paridade 


Alguns desses resultados são casos especiais da propriedade de paridade dos polinômios de Legendre. Referimo- 
nos mais uma vez às Equações (12.4) e (12.8). Se substituirmos x por —x e t por —t, a função geradora não muda. 
Daí, 
2771/2 
g(t, £) = g(—t, =x) = [1 = 2(—t)(~z) + (—+)°] 


= Ñ Pula" = Y Pa(ot” (12.36) 
n=0 n=0 


Comparando essas duas séries, temos 


Fac Ra) am (—1)” Pa(£) s (12.37) 


isto é, as funções polinomiais são ímpares ou pares (com relação a x = 0,6 = 7/2), conforme o índice n seja 
ímpar ou par. Essa é a propriedade de paridade” ou reflexão, que desempenha um papel tão importante na Mecânica 
Quântica. Para forças centrais, o índice n é uma medida do momento angular orbital, ligando assim a paridade e o 
momento angular orbital. 

Essa propriedade de paridade é confirmada pela solução de série e pelos valores especiais tabulados na 
Tabela 12.1. Também poderíamos observar que a Equação (12.37) pode ser prevista por inspeção da equação 
(12.17), a relação de recorrência. Especificamente, se P„—1 (x) e xP, (x) forem pares, então P, (x) deve ser par. 


Limites Superiores e Inferiores para P, (cos 0) 
Por fim, além desses resultados, nossa função geradora nos habilita a estabelecer um limite superior para 
|Pa(cos 8)|. Temos 


(1-2tcos0 +82) = (1-4) 2 —teiy A 
= (tea tee aan) 
(1+ te + Be MO 4), (12.38) 


com todos os coeficientes positivos. Nosso polinômio de Legendre, P, (cos 0)), ainda o coeficiente de t”, agora 
pode ser reescrito como uma soma de termos da forma 


ale ue = amcosmð , (12.39a) 


com todos os am positivos e m e n pares ou ímpares, de modo que 


Pa(cos0) = > am cos Mô. (12.39b) 


m=0 or 1 


6A notação de fatorial duplo é definida na Seção 8.1: 


(2n)!!! =2-4-6--- (2n),  (Qn-Dll=1:3:5-(Qn-D, (-Dl=1. 


7Em coordenadas polares esféricas, a inversão do ponto (r, 0, p) passando pela origem é conseguida pela transformação [r — r, 0 — m—0, 
ey — ọ + n]. Então, cos 8 — cos(m — 0) = — cos, o que corresponde a x — —a (compare com o Exercício 2.5.8). 
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Essa série, Equação (12.39b), é claramente um máximo quando 0 = 0 e cos m0 = 1. Mas, para x = cos 0 = 1, a 
Equação (12.31) mostra que P„(1) = 1. Portanto, 


[Palcos 6)| < Pa(1) = 1. (12.39c) 


Um benefício adicional da Equação (12.39b) é que ela mostra que nosso polinômio de Legendre é uma combinação 

linear de cos m8. Isso significa que os polinômios de Legendre formam um conjunto completo para quaisquer 

funções que possam ser expandidas para uma série de Fourier de co-seno (Seção 14.1) no intervalo [0, 7]. 

e Nesta seção, várias propriedades úteis dos polinômios de Legendre foram derivadas da função geradora, 
Equação (12.4). 

e A representação explícita de série, Equação (12.8), oferece uma abordagem alternativa e, às vezes, superior. 


Exercícios 
12.21 Dada a série 


ag + as cos? 0 + au cost 6 + ag cos? 8 = ao Po + a2 Pz + a4P4 + ag P3, 


expresse os coeficientes a; como um vetor coluna a e os coeficientes a; como um vetor coluna a e 
determine as matrizes A e B, tais que 


Aa =a e Ba = a. 
Verifique seu cálculo mostrando que AB = 1 (matriz unitária). Repita para o caso ímpar. 
a cos 0 + ag cos? 0 +ascos 0 + ay cos” 0 = a1 Pa +asP; + as Ps + ay Pz. 


Nota: P„(cos 0) e cos” 0 são tabulados em termos um do outro em AMS-55 (a referência completa 
é fornecida nas Leituras Adicionais do Capítulo 8). 


12.2.2 Por diferenciação da função geradora g(t, x) com relação a t, multiplicando por 2t, e então 
adicionando g(t, x), mostre que 


1— = f 
(1 = 2z + t2) > 2n +1) Pale)”. 
n=0 


Esse resultado é útil no cálculo da carga induzida em uma esfera de metal aterrada por uma carga 
pontual q. 


12.2.3 (a) Derive a Equação (12.27), 
(1 = 2?) Pi (£) = (n + 1)£ Pp (x) — (n + 1)Pap1 (2). 


(b) Escreva a relação entre a Equação (12.27) e as equações precedentes em forma simbólica 
análoga às formas simbólicas para as Equações (12.23) a (12.26). 


12.2.4 Um octopolo elétrico pontual pode ser construído colocando um quadrupolo elétrico pontual 
(intesidade do pólo pt) na direção z), em z = a, e um quadrupolo elétrico pontual, igual mas 
oposto em z = 0, e então deixando que a — 0, sujeito a pa = constante. Ache o potencial 
eletrostático correspondente a um octopolo elétrico pontual. Pela construção do octopolo elétrico 
pontual, mostre que o potencial correspondente pode ser obtido por diferenciação do potencial de 
quadrupolo pontual. 


12.2.5 | Operando em coordenadas polares esféricas, mostre que 


O | Palcos 6) Pasi(cos 6) 
>| pr | (n+1) pat? ' 


Essa é a etapa fundamental do argumento matemático que afirma que a derivada de um multipolo 
leva ao seguinte multipolo mais alto. 
Sugestão: Compare com o Exercício 2.5.12. 
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12.2.6 Por P 
1 ð 2\ —1/2 
Pr (cos 0) = qam Tos +t ) E 
mostre que 
P(D)=1,  P(-D=(-1). 
12.2.7 Prove que 
d 1 
= qe elz- = an + 1). 
12.2.8 Mostre que P„(cos0) = (—1)" P,(— cos 0) utilizando a relação de recorrência que relaciona 


Pa, Pa+1 € Pn—1 e admitindo que você conhece Py e Pi. 


12.2.9 Pela Equação (12.38) escreva o coeficiente de t? em termos de cosn0, n < 2. Esse coeficiente é 
Po(cos 0). 


12.2.10 Escreva um programa para gerar os coeficientes as na forma polinomial do polinômio de Legendre 


12.2.11 (a) Calcule Po(x) na faixa [0, 1] e esboce seus resultados. 

(b) Calcule valores precisos (no mínimo até a quinta casa decimal) das cinco raízes positivas de 
Pro(x). Compare seus valores com os relacionados em AMS-55, Tabela 25.4. (A referência 
completa é fornecida em Leituras Adicionais do Capítulo 8.) 

12.2.12 (a) Calcule a maior raiz de P, (x), para n = 2(1)50. 

(b) Desenvolva uma aproximação para a maior raiz a partir da representação hipergeométrica 
de P„(x) (Seção 13.4) e compare os valores que obteve na parte (a) com sua aproximação 
hipergeométrica. Compare também com os valores relacionados em AMS-55, Tabela 25.4. (A 
referência completa é fornecida em Leituras Adicionais do Capítulo 8.) 


12.2.13 (a) Pelo Exercício 12.2.1 e AMS-55, Tabela 22.9, desenvolva a matriz B 6 x 6 que transformará 

uma série de polinômios de Legendre de ordem par até Pjo(x) em uma série de potências 
4 Anr”. 

(b) Calcule A como B”!. Verifique os elementos de A em comparação com os valores relacionados 
em AMS-55, Tabela 22.9. (A referência completa é fonecida em Leituras Adicionais do 
Capítulo 8.) 

(c) Utilizando multiplicação de matrizes, transforme algumas séries de potências pares 
Es Ar?” em uma série de Legendre. 


12.2.14 Escreva uma sub-rotina para transformar uma série finita de potências = An x” em uma série de 
Legendre T bn Pa (x). Use a relação de recorrência, Equação (12.17), e siga a técnica delineada 
na Seção 13.3 para a série de Chebyshev. 


12.3 Ortogonalidade 


A EDO de Legendre (12.28) pode ser escrita na forma 


d 
P — x°) P! (x)| + n(n + 1)P,(£) = 0, (12.40) 
mostrando claramente que ela é auto-adjunta. Então, na dependência de satisfazer certas condições de contorno, 
sabemos que as soluções P, (x) serão ortogonais. Comparando a Equação (12.40) com as Equações (10.6) e (10.8), 
vemos que a função peso w(x) = 1, L = (d/dx)(1 — «2)(d/da), p(x) = 1 — x2, e que o autovalor À = n(n + 1). 
Os limites de integração para x são +1, em que p(+1) = 0. Então, para m Æ n, a Equação (10.34) se torna 


1 
/ Pa(x)Pm(x) dy = 0,º (12.41) 


—1 


/ Palcos 0)Pm(cos0)sen 0 do = 0, (12.42) 
0 
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mostrando que P„(x) e Pn(1) são ortogonais para o intervalo [—1,1]. Essa ortogonalidade também pode ser 
demonstrada usando a definição de Rodrigues de P, (x) (compare com a Seção 12.4, Exercício 12.4.2). 

Precisaremos avaliar a integral (Equação (12.41)) quando n = m. Por certo, já não é mais zero. Pela nossa 
função geradora, 


as 2 
(1 — 2tz + e) = > rue] (12.43) 
n=0 
Integrando de x = —1 a x = +1, temos 
1 oo 1 
dx 2 
aN R dz; 12.44 
| nir > Ji (x)] T; ( ) 
os termos cruzados da série desaparecem por meio da Equação (12.42). Usando y = 1 — 2tr + t2, dy = —2t dz, 
obtemos j2 
1 (+t 
d 1 d 1 1+t 
/ Z - J sL a( 1#) (12.45) 
Expandindo essa expressão em uma série de potências (Exercício 5.4.1), temos 
1, /1+t Ee Ar 
-h| — ] =2 ; 12.4 
(5) mi RAD 


Comparando coeficientes da série de potências das Equações (12.44), e (12.46), devemos ter 


L [Pa (2)]" da = zl (12.47) 
Combinando a Equação (12.42) com a Equação (12.47), temos a condição de ortonormalidade 
j 2Ômn 
F Pnlx)Pa(a) de = RE (12.48) 


Voltaremos a esse resultado na Seção (12.6), quando construirmos os harmônicos esféricos ortonormais. 


Expansão de Funções, Série de Legendre 
Além da ortogonalidade, a teoria de Sturm-Liouville implica que os polinômios de Legendre formam um conjunto 
completo. Então, vamos admitir que a série 


X anPa (£) = f(2) (12.49) 
n=0 


convirja na média (Seção 10.4) no intervalo [—1, 1]. Isso exige que f(x) e f'(x) sejam ao menos seccionalmente 
contínuas nesse intervalo. Os coeficientes a, são encontrados multiplicando a série por Pm(x) e integrando termo 
a termo. Usando a propriedade de ortogonalidade expressa nas Equações (12.42) e (12.48), obtemos 


2 


1 
m41” i f(x) Pn(a) dz. (12.50) 


Substituímos a variável de integração x por t e o índice m por n. Então, substituindo na Equação (12.49), temos 


fæ) => a PRO ar) P(x). (12.51) 


n=0 


$Na Seção 10.4 essas integrais eram interpretadas como produtos internos em um espaço vetorial (funcional) linear. Notações alternativas 
são 


$ 
f [Paa Pala) dz = (Pa|Pm) = (Pa, Pm). 


A forma (), popularizada por Dirac, é comum na literatura física. A forma () é mais comum na literatura matemática. 
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Essa expansão em uma série de polinômios de Legendre costuma ser denominada série de Legendre.? Suas 
propriedades são bem similares às da mais familiar série de Fourier (Capítulo 14). Em particular, podemos usar a 
propriedade da ortogonalidade (Equação (12.48)) para mostrar que a série é única. 

Em um nível mais abstrato (e mais poderoso), a Equação (12.51) dá a representação de f(x) no espaço vetorial 
de polinômios de Legendre (um espaço de Hilbert, Seção 10.4). 

Do ponto de vista de transformadas integrais (Capítulo 15), a Equação (12.50) pode ser considerada uma 
transformada finita de Legendre de f(x). Então, a equação (12.51) é a transformada inversa. Ela também pode 
ser interpretada em termos dos operadores de projeção da teoria quântica. Podemos considerar P,, em 


Pafe) = Polo) PS S POO 


um operador (integral), pronto para operar sobre f(t). (A f(t) entraria nos colchetes como um fator no integrando.) 
Então, pela Equação (12.50), 


[Pm fita) = e E Pao 


O operador Pm projeta a m-ésima componente da função f. 

A Equação (12.3), que leva diretamente à definição de função geradora de polinômios de Legendre, é uma 
expansão de Legendre de 1/71. Essa expansão de Legendre de 1/rı ou 1/r12 aparece em diversos exercícios da 
Seção 12.8. Indo além de um campo de Coulomb, muitas vezes a 1/r12 é substituída por um potencial V (|rı —rs|), 
e a solução do problema é novamente efetivada por uma expansão de Legendre. 

A série de Legendre, Equação (12.49), foi tratada como uma função conhecida f(x) que escolhemos 
arbitrariamente para expandir em uma série de polinômios de Legendre. Às vezes, a origem e a natureza das 
séries de Legendre são diferentes. Nos exemplos a seguir consideramos funções desconhecidas que sabemos que 
podem ser representadas por uma série de Legendre por causa da equação diferencial que as funções desconhecidas 
satisfazem. Como antes, o problema é determinar os coeficientes desconhecidos na expansão de série. Contudo, 
aqui, os coeficientes não são encontrados pela Equação (12.50). Mais exatamente, são determinados pela exigência 
de que a série de Legendre satisfaça uma solução em um contorno. Esses são problemas de valor de contorno. 


Exemplo 12.3.1 CAMPO GRAVITACIONAL DA TERRA 


Um exemplo de uma série de Legendre é dado pela descrição do potencial gravitacional da Terra U (para pontos 
externos), desprezando efeitos azimutais. Sendo 


R = raio equatorial = 6378,1 + 0,1 km 


M 
M = 62, 494 + 0, 001 km? /3?, 
escrevemos 
GM|R & CA 
A |5- Loly) P, (cos o) 3 (12.52) 


uma série de Legendre. Movimentos de satélites artificiais mostraram que 


az = (1.082.635 + 11) x 107°, 
az = (—2.531 + 7) x 107°, 
a4 = (—1.600 + 12) x 107°. 


Essa é a famosa deformação da Terra em forma de pêra. Outros coeficientes foram calculados até n = 20. Note 
que P, é omitido porque a origem a partir da qual r é medido é o centro de massa da Terra (P, representaria um 
deslocamento). 

Dados de satélites mais recentes permitem uma determinação da dependência longitudinal do campo 
gravitacional da Terra. Tal dependência pode ser descrita por uma série de Laplace (Seção 12.6). E 


Note que a Equação (12.50) considera am uma integral definida, isto é, um número para uma dada f(x). 
10 As variáveis dependentes são arbitrárias. Aqui x veio de x em Pm. 
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Exemplo 12.3.2 ESFERA EM UM CAMPO UNIFORME 


Uma outra ilustração da utilização de polinômios de Legendre é dada pelo problema de uma esfera condutora 
neutra (raio ro) colocada em um campo elétrico (previamente) uniforme (Figura 12.8). O problema é achar o novo 
potencial eletrostático perturbado. Se denominarmos o potencial eletrostático!! V, ele satisfaz 


a N 


| 


TS 
© 


Figura 12.8: Esfera condutora em um campo uniforme. 


V?V =0, (12.53) 


a equação de Laplace. Selecionamos coordenadas polares esféricas por causa do formato esférico do condutor. (Isso 
simplificará a aplicação da condição de contorno na superfície do condutor.) Separando variáveis e consultando a 
Tabela 9.2, podemos escrever o potencial desconhecido V (r, 0) na região fora da esfera como uma combinação 
linear de soluções: 


V(r,0) = 3) anr” Palcos 0) + X> e O), (12.54) 
n=0 n=0 


Não aparece nenhuma dependência de y por causa da simetria axial de nosso problema. (O centro da esfera 
condutora é considerado a origem e o eixo z é orientado paralelamente ao campo uniforme original.) 

Poderíamos observar que n é um inteiro, porque somente para n inteiro é que a dependência de 0 é bem- 
comportada em cos 0 = 1. Para n não-inteiro as soluções da equação de Legendre divergem nas extremidades 
do intervalo [—1, 1], os pólos 9 = 0, 7 da esfera (compare com o Exemplo 5.2.4 e Exercícios 5.2.15 e 9.5.5). É por 
essa mesma razão que a segunda solução da equação de Legendre, Qn, também é excluída. 

Agora recorremos às nossas condições de contorno (Dirichlet) para determinar os a, e bn desconhecidos de 
nossa solução de série, Equação (12.54). Se o campo eletrostático original não-perturbado é Eo, impomos, como 
condição de contorno, 


V(r => œ) = —Eoz = — Eor cos 0 = — Eor Pı (cos 0). (12.55) 


Uma vez que nossa série de Legendre é única, podemos igualar os coeficientes de P, (cos 0) na Equação (12.54) 
(r — œo) e na Equação (12.55), para obter 


m=0, n>1 e n=0, =- (12.56) 


Se an Æ 0, para n > 1, esses termos dominariam em r grande e a condição de contorno (Equação (12.55)) não 
poderia ser satisfeita. 

Como uma segunda condição de contorno, podemos escolher que a esfera condutora e o plano 6 = 7/2 estejam 
em potencial zero, o que significa que a Equação (12.54) agora se torna 


b b X P(cos6 
Vle = ro) = 22 + (Bi — Boro Pilos) + Y tu EERO — 0 (12.57) 
n=2 0 


Devemos salientar que isso não é uma apresentação de uma expansão de série de Legendre de um V (cos 0) conhecido. Aqui, estamos de 
volta aos problemas de condição de contorno de EDPs. 
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Para que isso possa valer para todos os valores de 0, cada coeficiente de P, (cos 0) deve desaparecer.!? Daí, 


bo = 0,8 bn = 0, n > 2, (12.58) 
enquanto 
bı = Eor. (12.59) 
O potencial eletrostático (fora da esfera) então é 
Eor rè 
V = — Eor Pı (cos 8) + —s Pı (cos 0) = —EorPi(cos0)[1 — = ). (12.60) 
r r 


Na Seção 1.16 mostramos que uma solução da equação de Laplace que satisfizesse as condições de contorno 
em todo o contorno era única. O potencial eletrostático V, como dado pela Equação (12.60), é uma solução da 
equação de Laplace. Ela satisfaz nossas condições de fronteira e, portanto, é a solução da equação de Laplace para 
esse problema. 

Podemos mostrar ainda (Exercício 12.3.13) que há uma densidade de carga superficial induzida 


oV 
o= -Eoy = 3£0 E0 cos 0 (12.61) 


T=T0 
sobre a superfície da esfera e um momento de dipolo elétrico induzido (Exercício 12.3.13) 


P = 4rrłeo Eo. (12.62) 
E 


Exemplo 12.3.3 POTENCIAL ELETROSTÁTICO DE UM ANEL DE CARGA 

Como mais um exemplo, consideramos o potencial eletrostático produzido por um anel condutivo que transporta 
uma carga elétrica total q (Figura 12.9). Pela eletrostática (e Seção 1.14), o potencial 1) satisfaz a equação de 
Laplace. Separando variáveis em coordenadas polares esféricas (compare com a Tabela 9.2), obtemos 


X 


Figura 12.9: Anel condutor carregado. 


yr) =D cur Palcos 9), r>a. (12.634) 


!2Novamente, isso equivale a dizer que uma expansão de série em polinômios de Legendre (ou qualquer conjunto completo ortogonal) é 
única. 

130 coeficiente de Po é bo /ro. Estabelecemos bo = O porque não há nenhuma carga líquida na esfera. Se houver uma carga líquida q, então 
bo £ 0. 
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Aqui, a é o raio do anel que admitimos estar no plano 6 = 7/2. Não há nenhuma dependência de ọ (azimutal) por 
causa da simetria cilíndrica do sistema. Os termos com expoente positivo na dependência radial foram rejeitados 
porque o potencial deve ter um comportamento assintótico, 


1 
pm. r>a (12.63b) 
47e0 r 
O problema é determinar os coeficientes c, na Equação (12.63a). Isso pode ser feito avaliando y(r, 0) em 
0 = 0,r = z, e comparando com um cálculo independente do potencial pela lei de Coulomb. Na realidade, 
estamos usando uma condição de contorno ao longo do eixo z. Pela lei de C (com todas as cargas eqüidistantes), 


.gI 1 0=0 
phr, 8) o ATE0 (22 + a2)1/2" i r= z, 
EE e a O 
— 4TEgZ A 1) 22s(s)2 À z , z>a. (12.630) 


A última etapa usa o resultado do Exercício 8.1.15. Agora, a Equação (12.63a) avaliada em 0 = 0,r = z (com 
Pa(1) = 1), resulta em 


a 
Un)=D en TSA (12.63) 


Comparando as Equações (12.63c) e (12.63d), obtemos cn = 0 para n ímpar. Estabelecendo n = 2s, temos 


(28)! 


q 
= 1)º ; 12.63 

E T ) 22s(s!)2 ( #9 

e nosso potencial eletrostático %(r, 8) é dado por 
y(r, 0) = — S~ ye ad > (12.638) 

r.0)= s(cos 0), r>a. i 
É Aner E 22s(s!)2 \r 3 
O análogo magnético desse problema aparece no Exemplo 12.5.3. E 
Exercícios 

12.3.1 Você construiu um conjunto de funções ortogonais pelo processo de Gram-Schmidt (Seção 10.3), 
considerando un(x) = x”, n = 0,1,2,..., em ordem crescente com w(x) = 1 e um intervalo 


—1 < x < 1. Prove que a enésima dessas funções construídas é proporcional a P, (x). 
Sugestão: Use indução matemática. 

12.3.2 Expanda a função delta de Dirac em uma série de polinômios de Legendre usando o intervalo 
—I<a<l. 


12.3.3 Verifique as expansões de função delta de Dirac 


CEED mi SPG 
n=0 

d0 +a) = (2H pa). 
n=0 


Essas expressões aparecem em uma resolução da expansão da onda plana de Rayleigh (Exercício 

12.4.7) em ondas esféricas incidente e emergente. 

Nota: Admita que toda função delta de Dirac é coberta quando integrada no intervalo [—1, 1]. 
12.3.4 Nĉutrons (massa 1) são espalhados por um núcleo de massa A (A > 1). No sistema de centro 

de massa, o espalhamento é isotrópico é isotrópico. Então, no sistema de laboratório, a média do 

co-seno do ângulo de deflexão do nêutron é 


1/7 Acos0+1 
= 6 do. 
ee |, (A? + 2Acos0 + 1)1/2º 


Mostre, por expansão do denominador, que (cos y} = 2/34. 
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12.3.5 


12.3.6 


12.3.7 


12.3.8 


12.3.9 


12.3.10 


12.3.11 


12.3.12 


Uma determinada função f(x) definida no intervalo [—1, 1] é expandida em uma série de Legendre 
nesse mesmo intervalo. Mostre que a expansão é única. 


Uma função f(x) é expandida em uma série de Legendre f(x) = 5 6 an Pa (x£). Mostre que 


1 2 z Za? 
[Bo e- 5 


Essa é a forma de Legendre da série de Fourier identidade de Parseval, Exercício 14.4.2. Ela também 
ilustra a desigualdade de Bessel, Equação (10.72), tornando-se uma igualdade para um conjunto 
completo. 


Derive a relação de recorrência 
(1 — x°) P! (£) = nPa-1 (£) — nz Pp (x) 
pela função 7A de polinômios de Legendre. 


Avalie Jy Pr x) dz. 
Resposta: n = 2s; l para s = 0, 0 para s > 0, 
n=2s+1; Pzs(0)/(2s +2) = (—1)º(2s — 1)!!/1(2s + 2)!! 
Sugestão: Use uma relação de recorrência para substituir P, (x) por derivadas e então integre por 
inspeção. Alternativamente, você pode integrar a função geradora. 
(a) Para 


(ai= +, 0O<x<l 
“LA, —I<ar<o, 


mostre que 
1 oo 2 
2 (2n — 1)! 
da = 2 > 4 3)|>— |. 
fo pa Fra O 
(b) Testando a série, prove que ela é convergente. 


Prove que 


, 


1 
i Pe P!l, dx = 0, a menos quem =n+1 
-1 
2n(n? — 1) 
= n2 m,n=1; sem <n. 
2 2)(n+1 
= nin + 2)(n Omna sem >n. 


(2n +1)(2n +3) 


A amplitude de uma onda espalhada é dada por 


1 OO 
=g sl 21 + 1) exp[iói]sen ó;Pi(cos 0). 
1=0 


Aqui, 0 é o ângulo de espalhamento, l é o autovalor do momento angular, hk é o momentum 
incidente e ô; é a mudança de fase produzida pelo potencial central que está fazendo o espalhamento. 
A seção de choque total é otot = f |f(9)|? dQ. Mostre que 


=S pia 
Otot = oR + )sen t: 
1=0 
A taxa de contagem de coincidências, W (0), em um experimento de correlação angular gama-gama 
tem a forma 


OO 
W (0) = DD a2nPon(cos 0). 
n=0 
Mostre que os dados na faixa 7/2 < 0 < m podem, em princípio, definir a função W (0) (e 
permitir uma determinação dos coeficientes azn). Isso significa que, embora os dados no intervalo 
0 < 8 < 7/2 possam ser úteis como verificação, não são essenciais. 
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12.3.13 Uma esfera condutora de raio ro é colocada em um campo elétrico inicialmente uniforme, Eo. 
Mostre o seguinte: 
(a) A densidade de carga superficial induzida é 
o = 3£0 Eo cos 0. 
(b) O momento de dipolo elétrico induzido é 
P = 4rrłeo Eo. 
O momento de dipolo elétrico induzido pode ser calculado pela carga superficial [parte (a)] ou 
observando que o campo elétrico final E é o resultado da sobreposição de um campo de dipolo 
ao campo uniforme original. 
12.3.14 Uma carga q é deslocada uma distância a ao longo do eixo z a partir do centro de uma cavidade 
esférica de raio R. 
(a) Mostre que o campo elétrico médio sobre o volume a < r < Ré zero. 
(b) Mostre que o campo elétrico médio calculado sobre o volume O < 7 < a é 
E = ŻE, = —ż2 AE (unidades SI) = E 
em que n é o numero de tais cargas deslocadas por unidade de volume. Esse é um cálculo básico na 
polarização de um dielétrico. 
Sugestão: E = —Vq. 
12.3.15 Determine o potencial eletrostático (expansão de Legendre) de um anel circular de carga elétrica 
parar <a. 
12.3.16 Calcule o campo elétrico produzido pelo anel condutor carregado do Exemplo 12.3.3 para 
(a) r>a, (b) r<a. 
12.3.17 Como uma extensão do Exemplo 12.3.3, ache o potencial (r, 0) produzido por um disco condutor 
carregado, Figura 12.10, para r > a, o raio do disco. A densidade de carga o (sobre cada lado do 
disco) é 
Z 
a 
y 
X 
Figura 12.10: Disco condutor carregado. 
()=— 55º P=esry. 
4ra(a2 — p?)!/2 
Sugestão: A integral definida que você obtém pode ser válida como uma função beta, Seção 8.4. 
Para mais detalhes, veja a Seção 5.03 de Smythe em Leituras Adicionais. 
o0 2l 
f -.4 ıl fa l 
Resposta: (r, 0) = E 2 1) Ii (=) Pa (cos 0). 
12.3.18 Pelo resultado do Exercício 12.3.17, calcule o potencial do disco. Uma vez que você está violando 


a condição r > a, justifique seu cálculo. 
Sugestão: Você pode encontrar a série apresentada no Exercício 5.2.9. 
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12.3.19 


12.3.20 


12.3.21 


12.3.22 


12.3.23 


12.3.24 


12.3.25 


O hemisfério definido por r = a,0 < 6 < 7/2, tem um potencial eletrostático +Vo. O hemisfério 
r =a,Tt/2 < 0 < m tem um potencial eletrostático — Vo. Mostre que o potencial nos pontos 
internos é 


2 An+3/r\ t 
V = Vo > EEE (=) Pon(0) Poa (cos 0) 


2n + 2 
n=0 
3 n (4n + 3)(2n — 1)! /r 2n+1 
Ra a (2n + 2)! (=) Ponsi(cos 6). 


Sugestão: Você precisa do Exercício 12.3.8. 

Uma esfera condutora de raio a é dividida em dois hemisférios separados eletricamente por uma fina 
barreira isolante em seu equador. O hemisfério superior é mantido em um potencial Vo, o hemisfério 
inferior, em — Vo. 


(a) Mostre que o potencial eletrostático externo aos dois hemisférios é 


o0 2s+2 
V(r,0) = Vo bd parai (E ) Prsn(cos 6). 


(b) Calcule a densidade de carga elétrica o na superfície externa. Note que sua série diverge em 
cos 0 = +1, como você esperava da capacitância infinita desse sistema (espessura zero para a 
barreira isolante). 


ƏV 
RESP. o = Eo En = —E0 K 
Or | 
1)! 
= = £0 Vo Do “(4s +3 Pie lcos 0). 
Na notação da Seção 10.4, p,(£) = (2s + 1)/2Ps(x), um polinômio de Legendre é 


renormalizado para unidade. Explique como |.)(7.| age como um operador de projeção. Em 
particular, mostre que, se |f) = 31, al), então 


los Psl f) = aslps)- 


Expanda z8 como uma série de Legendre. Determine os coeficientes de Legendre pela 


Equação (12.50), 


2m+1 f! 
am = m / xë Pn(x) dz. 
=i 


Verifique seus valores comparando-os com AMS-55, Tabela 22.9. (A referência completa é 
fornecida em Leituras Adicionais do Capítulo 8.) Isso ilustra a expansão de uma função simples 
f(x). Na verdade, se f(x) for expressa como uma série de potências, a técnica do Exercício 12.2.14 
é mais rápida e também mais precisa. 

Sugestão: Pode-se usar quadratura gaussiana para avaliar a integral. 


Calcule e tabule o potencial eletrostático criado por um anel de carga, Exemplo 12.3.3, para 
r/a = 1,5(0,5)5,0 e 0 = 0º(15º)90º. Vá até o termo P22(cos 0). 
Nota: A convergência de sua série será lenta para r/a = 1,5. O truncamento da série em Po», limita 
você a uma precisão de cerca de quatro algarismos significativos. 

Valor de verificação. Para r/a = 2,5 e 0 = 60°, y = 0, 40272 (q/4reor). 
Calcule e tabule o potencial eletrostático criado por um disco carregado, Exercício 12.3.17, para 
r/a = 1,5(0,5)5,0e 0 = 0º(15º)90º. Vá até o termo P22(cos 0). 

Valor de verificação. Para r/a = 2,0 e 0 = 15°, y = 0,46638(g/47eor). 
Calcule os primeiros cinco coeficientes (que não desaparecem) na expansão de série de Legendre 
de f(x) = 1 — |z| usando a Equação (12.51) integração numérica. Na verdade, esses coeficientes 


podem ser obtidos em forma fechada. Compare seus coeficientes com os obtidos pelo Exercício 
13.3.28. 
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Resposta: ao = 0, 5000, ao = —0, 6250, a4 = 0, 1875, as = —0, 1016, ag = 0, 0664. 
12.3.26 Calcule e tabule o potencial eletrostático externo criado pelos dois hemisférios carregados do 
Exercício 12.3.20, para r/a = 1, 5(0,5)5,0 e 0 = 0º(15º)90º. Vá até o termo Pos(cos 0). 
Valor de verificação. Para r/a = 2,0 e 0 = 45°, V = 0, 27066 Vo. 
12.3.27 (a) Dados f(x) = 2,0,|z| < 0,5; f(x) = 0,0,5 < |z| < 1,0, expanda f(x) em uma série de 
Legendre e calcule os coeficientes an até ago (analiticamente). 
(b) Avalie 5582 an Pn (£), para x = 0, 400(0, 005)0, 600. Esboce seus resultados. 
Nota: Isso ilustra o fenômeno de Gibbs da Seção 14.5 e o perigo de tentar calcular com uma 
expansão de série na vizinhança de uma descontinuidade. 


12.4 Definições Alternativas de Polinômios de Legendre 


Fórmula de Rodrigues 


A forma de série dos polinômios de Legendre (Equação (12.8)) da Seção (12.1) pode ser transformada como segue. 
Pela Equação (12.8), 


Emo Si pp eea (12.64) 
ONES E mrin — Min — r)i” ` . 
Para n inteiro, 
[n/2] = 
= r 1 d 2n—2r 
l d "S (=1)"n! 2n—2r 
“ral (x) > rt(n — r)” é (12.644) 


Observe a extensão do limite superior. Solicitamos ao leitor que mostre no Exercício 12.4.1 que os termos 
adicionais [n/2] + 1 a n no somatório nada contribuem. Contudo, o efeito desses termos extras é permitir a 
substituição do novo somatório por (x? — 1)” (mais uma vez, o teorema binomial) para obter 


1 d e n 
P,(£) = 2-1). 12. 

(x) 2"n! (5) (z ) (12.65) 
Essa é a fórmula de Rodrigues. Ela é útil para provar muitas das propriedades dos polinômios de Legendre, tal 
como ortogonalidade. Uma aplicação relacionada é vista no Exercício 12.4.3. A definição de Rodrigues é estendida 
na Seção (12.5) para definir as funções associadas de Legendre. Na Seção (12.7) ela é usada para identificar as 
autofunções do momento angular orbital. 


Integral de Schlaefli 
A fórmula de Rodrigues nos dá um meio de desenvolver uma representação integral de P, (z). Usando a fórmula 
integral de Cauchy (Seção 6.4) 


1 f IH 
= — dt 12. 
He) 2mi J t-z (ABG) 
com 
f(a = (2 - 1)”, (12.67) 
temos (1? ) 
1 te — 1)” 
2—1)” = f dt. 12. 
(z ) 27% t-z (126) 
Diferenciando n vezes em relação a z e multiplicando por 1/2”n!, temos 
1 d n 2? (t? -— 1)” 
Pi(z) = 2-D)'= dt, 12.69 
(2) 2"n! dz” E 2mi f (t— z)r+ ( ) 


sendo que o contorno inclui o ponto t = z. 

Essa é a integral de Schlaefli. Margenau e Murphy!“ usam essa expressão para derivar as relações de recorrência 
que obtemos da função geradora. 

Pode-se mostrar imediatamente que a integral de Schlaefli satisfaz a equação de Legendre por diferenciação e 
substituição direta (Figura 12.11). Obtemos 


14H. Margenau e G. M. Murphy, The Mathematics of Physics and Chemistry, 22 ed., Princeton, NJ: Van Nostrand (1956), Seção 3.5. 
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linha de corte 


Figura 12.11: Contorno da integral de Schlaefli. 


d2P, dP, n+1 fode 1t 
1-2? m de DB, = dt. 12.7 
(1-2?) q2 FF +n(n+1) SET) H | TEP (12.70) 


Para n inteiro, nossa função (t? — 1)”+!/(t — z)”+? é de valor único e a integral ao redor do caminho fechado 
se anula. A integral de Schlaefli também pode ser usada para definir P,(z) para v não-inteiro integrando ao 
redor dos pontos t = z, t = 1, mas sem cruzar a linha de corte —1 a —oo. Também poderíamos perfeitamente 
circundar os pontos t = z e t = —1, mas isso não levaria a nada de novo. Um contorno ao redor de t = +1 e 
t = —1 levaria a uma segunda solução, Q, (z), Seção (12.10). 


Exercícios 


12.4.1 


12.4.2 


12.4.3 


12.4.4 


12.4.5 


12.4.6 


Mostre que cada termo do somatório 


o (=) (—1)”n! g2 2r 
l — r)! 

E ee dr) ri(n-r)! 

se anula (r e n inteiros). 


Usando a fórmula de Rodrigues, mostre que os P, (x) são ortogonais e que 


1 5 2 
f [Po dz = mr 


Sugestão: Use a fórmula de Rodrigues e integre por partes. 


Mostre que T a” P,(x)da = 0 quando m < n. 
Sugestão: Use a fórmula de Rodrigues ou expanda x” em polinômios de Legendre. 


1 
2"Hnlm! 


Nota: A intenção é que você use a fórmula de Rodrigues e integre por partes, mas veja também se 
consegue obter o resultado pela Equação (12.8) por inspeção. 


l? x” Pon(x) de = 2º" Err tn!) r>n 
4 gi (2r +2n + Dl(r — n)!’ E 


Mostre que 


Mostre que 


Como generalização dos Exercícios 12.4.4 e 12.4.5, mostre que as expansões de Legendre de x° 
são 
(a) r” = 5 22" (4n + D)(21)!(r +n)! 
e (2r +2n + Dl(r— n)! 
b) 2H = 5 220+ (4n + 3)(2r + Dr +n +1)! 
(2r + 2n +3)!(r-— n)! 


n(x), S= 2r, 


Pol), s=2r+1. 


n=0 
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12.4.7 Uma onda plana pode ser expandida em uma série de ondas esféricas pela equação de Rayleigh, 
gun se Anjn(kr)Pa(cos 9). 
n=0 
Mostre que a, = i” (2n + 1). 
Sugestão: 
1. Use a ortogonalidade dos P,, para resolver para an jn(kr). 
2. Diferencie n vezes com relação a (kr) e estabeleça r = 0 para eliminar a dependência de r. 
3. Avalie a integral remanescente pelo Exercício 12.4.4. 
Nota: Esse problema também pode ser tratado observando que ambos os lados da equação 
satisfazem a equação de Helmholtz. A igualdade pode ser estabelecida mostrando que as soluções 
têm o mesmo comportamento na origem e também se comportam da mesma maneira em grandes 
distâncias. Um tipo de solução “por inspeção” é desenvolvido na Seção 9.7 usando funções de 
Green. 
12.4.8 Verifique a equação de Rayleigh do Exercício 12.4.7 começando pelas seguintes etapas: 
(a) Diferencie com relação a (kr) para estabelecer 
RA . . 
X anjn (kr) Palcos y) = iX. anjn (kr) cos yPa (cos 9). 
(b) Use uma relação de recorrência para substituir cos yP, (cos) por uma combinação linear de 
Pa e Pra 
(c) Use uma relação de recorrência para substituir j/, por uma combinação linear de jn-1 € jn+1- 
12.4.9 Pelo Exercício 12.4.7, mostre que 
- 1 i ikru 
Ín(kr) = Jin e" Palu) du. 
boda 
Isso significa que (à parte um fator constante) a função esférica de Bessel jn, (kr) é a transformada 
de Fourier da polinomial de Legendre Pp (u). 
12.4.10 As funções polinomiais de Legendre e as funções esféricas de Bessel são relacionadas por 
1 A 
In(Z) = 560º f e'2cos0 P (cos O)sen 0 do, n=0,1,2,... 
0 
Verifique essa relação transformando o lado direito em 
z” e 2n+1 
mtini I cos(z cos 0)sen 6 dg 
e usando o Exercício 11.7.8. 
12.4.11 Por avaliação direta da integral de Schlaefli, mostre que P, (1) = 1. 
12.4.12 Explique por que o contorno da integral de Schlaefli, Equação (12.69), é escolhido para incluir os 
pontos t = z e t = 1 quando n — v, não sendo inteiro. 
12.4.13 Em trabalho numérico (por exemplo, a quadratura de Gauss-Legendre), é útil estabelecer que P, (a) 


tem n zeros reais no interior de [—1, 1]. Mostre que é isso mesmo. 

Sugestão: O teorema de Rolle mostra que a derivada de primeira ordem de (x? — 1)?” tem um zero 
no interior de [—1, 1]. Estenda esse argumento para as derivadas de segunda, terceira e, por fim, de 
enésima ordem. 


12.5 Funções Associadas de Legendre 


Quando a equação de Helmholtz é separada em coordenadas polares esféricas (Seção 9.3), uma das EDOs 
separadas é a equação associada de Legendre 


1 d dP™ (cos 8) m? Jome o n 
Spl nO) Ei þes De na BO, (12:71) 
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Com « = cos 6, essa expressão se torna 
d? d m? 
2 m m m Ra 

(=z ) ar (x) 21 Ph (x) + |n(n + 1) — ogir (x) = 0. (12.72) 

Se a constante de separação azimutal m? = 0, temos a equação de Legendre, Equação (12.28). As soluções 
regulares P?” (x) (com m não necessariamente zero, mas inteiro) são 
m/2 d” 

v = P” (x)= (1-2?) 2. Pala) (12.734) 
gm 


com m > 0 inteiro. 

Um modo de desenvolver a solução da equação associada de Legendre é começar com a equação de Legendre 
normal e convertê-la na equação associada de Legendre usando diferenciação múltipla. Essas diferenciações 
múltiplas são sugeridas pela Equação (12.73a), a geração de polinômios associados de Legendre, e harmônicos 
esféricos da Seção (12.6) de um modo mais geral, na Seção 4.3, usando operadores de elevação ou redução da 
Equação (4.69) repetidas vezes. Para sua forma derivada, veja o Exercício 12.6.8. Consideremos a equação de 
Legendre 


(1-2)P! -22P +n(n+1)P,=0, (12.74) 


e, com a ajuda da fórmula de Leibniz, diferenciamos m vezes. O resultado é 


(1-2)u” — 2r(m + Du + (n—-m)(n+m+1)u =0, (12.75) 
em que 
dad” 
u=-—P(a). (12.76) 
dam 


A Equação (12.74) não é auto-adjunta. Para colocá-la na forma auto-adjunta e converter a função de peso a 1, 
substituímos u(x) por 


m m PPa 
va) = (1-2?) ule) = (1-23) r (al: (12.73b) 
gm 
Resolvendo para u e diferenciando, obtemos 
may a-m/2 
u = (1 + ZC- ) ; (12.77) 
2mzv' mv mm + 2)x2v -m/2 
"= |u" + (1-2? 12.78 
a | Ian I" (1— r2)? (1 — 2?) ( ) 
Substituindo na Equação (12.74), constatamos que a nova função v satisfaz a EDO auto-adjunta 
2 
1-2)” — 2x0! + nn +1) — | v=0, (12.79) 
1-2? 


que é a equação associada de Legendre; ela se reduz à equação de Legendre quando m é igualado a zero. Expressa 
em coordenadas polares esféricas, a equação associada de Legendre é 


1 d dv m? 
0 1)— =0. 12. 
sen 0 dê (sen z) + nn A) | pad eat) 


15A fórmula de Leibniz para a derivada de enésima ordem de um produto é 


Z [4()B(o)] = 5 ( r) Ewo eo (1)- es 


s=0 


um coeficiente binomial. 
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Polinômios Associados de Legendre 
As soluções regulares, rotuladas agora como P?” (x), são 


m/2 d” 


v = PP (x)= (1 — x°) gami 


Pala). (12.73c) 

Essas são as funções associadas de Legendre.! Visto que a potência mais alta de x em P, (x) é x”, devemos ter 
m < n (ou a diferenciação m vezes conduzirá nossa função a zero). Em Mecânica Quântica, a interpretação física 
de exigir que m < n é que o valor esperado do quadrado da componente z do momento angular é menor ou igual 
ao valor esperado do quadrado do vetor de momento angular L, 


(18) < (EP) = f hinL dr 
Pela forma da Equação (12.73c) poderíamos esperar que m seja não-negativo. Contudo, se P, (x) for expresso 
pela fórmula de Rodrigues, essa limitação imposta a m é relaxada e podemos ter —n < m < n, sendo permitidos 
valores negativos, bem como valores positivos de m. Esses limites são consistentes com os obtidos por meio 
de operadores de elevação e redução no Capítulo 4. Em particular, |m| > n é excluído. Isso também resulta 
da Equação (12.73c). Usando a fórmula de diferenciação de Leibniz mais uma vez, podemos mostrar (Exercício 
12.5.1) que P?” (x) e Pz (x) são relacionados por 
-m m (n 
Fa (a) = (1) 


n 


Era) (12.81) 


Pela nossa definição das funções associadas de Legendre P” (a), 


P? (x) = Pla): (12.82) 


Uma função geradora para as funções associadas de Legendre é obtida, via a Equação (12.71), pela função geradora 
dos polinômios ordinários de Legendre: 


(Cm! — a2ym/2 
12.83 
2mml(1 — 2tx + t)m+1/2 5 srt ( ) 
Se descartarmos o fator (1 — x?)™/? = sen" dessa fórmula e definirmos os polinômios P% (x) = 
PR naea- x?) ™/2, então obtemos uma forma prática da função geradora, 
(2m)! 
Im(T, t) = 2mml(1 — 2tx + t2)m+1/2 =D Piin C) (TASA) 


Podemos derivar, por diferenciação, uma relação de recursão para olteni associados de Legendre que é 
análoga às Equações (12.14) e (12.17), como segue: 


Jm 


(1—-2tr +t?) dam = (2m + D(x — t)gm(z,t). 


Substituindo as expansões definidoras para polinômios associados de Legendre, obtemos 


(1 — 2ta + 15) 5 SP ml zi E = (2m e 1) 5 [IP mt — PH RTS: 


s S 


Comparando coeficientes de potências de t nessa série de potências, obtemos a relação de recorrência 
(s +1)P m41 — (2M + 128) Pm + (s + 2M) Pm- = 0. (12.85) 


Para m = 0 e s = n, essa relação é a Equação (12.17). 
Antes de podermos usar essa relação, precisamos iniciá-la, isto é, relacionar os polinômios associados de 
Legendre com polinômios ordinários de Legendre. Podemos usar P? = (2m — 1)!! da Equação (12.73c). Além 


!6Ocasionalmente (como em AMS-55; a referência completa é dada em Leituras Adicionais do Capítulo 8) encontramos definições das 
funções associadas de Legendre com um fator adicional de (— 1)”. Esse (— 1)” parece uma complicação desnecessária nesse ponto. Ele será 
incluído na definição dos harmônicos esféricos YW” (0, p) na Seção 12.6. Nossa definição está de acordo com Electrodynamics de Jackson 
(essa referência é fornecida em Leituras Adicionais do Capítulo 11). Note também que o índice superior, m não é um expoente. 
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disso, uma vez que |m| < n, podemos estabelecer P"+! = 0 e usar isso para obter valores de partida para vários 
processos recursivos. Observamos que 


(= 20t+ Ban(x,t) = (1 20t +)" o Pd (12.86) 
portanto, ao inserirmos a Equação (12.84), obtemos a recursão 


Pin — 222P} + Pl = Pa). (12.87) 


De modo mais geral, temos também a identidade 


(1 — 2xt + t’) gm41(2,t) = (2M + 1)gm(2,t), (12.88) 
da qual extraímos a recursão 
PELA 20PR + P a = (2m + PE alo): (12.89) 


que relaciona os polinômios associados de Legendre de superíndice m + 1 com os de índice m. Para m = 0, 
recuperamos a recursão inicial, Equação (12.87). 


Tabela 12.2 Funções associadas de Legendre 


P(x) = (1 — x?) !/? = sen 0 
P} (x) = 3x(1 — w?)!/2 = 3 cos sen 0 
P2 (x) = 3(1 — x?) = 3sen?0 
P} (x) = 3 (5x? — 1)(1 — x?) t? = 3 (5 cos? 0 — 1)sen O 
P2 (x) = 15x(1 — x?) = 15 cos ĝsen?0 
P3(x) = 15(1 — z?)3/2 = 15 sen30 
P} (x) = Š (7x — 3x)(1 — x?)!/? = 5 (7 cos? 0 — 3 cos 0)sen 0 
P?(x) = # (7x? — 1)(1 — £?) = # (7 cos? 6 — 1)sen?0 
Pi(a) = 105x(1 — a 105 cos ĝsen?0 
(x) 


Exemplo 12.5.1 Os PoLinômios ASSOCIADOS DE LEGENDRE DE ORDEM MAIS BAIXA 
Adora estamos prontos para derivar as entradas da Tabela 12.2. Para m = 1 e s = 0, a Equação (12.87) dá 
Pi = 1, porque P = 0 = P!, não ocorre na definição, Equação (12.84), dos polinômios associados de Legendre. 
Multiplicando por (1 — r?) = 2 — sen 0, obtemos a primeira linha da Tabela 12.2. Para s = 1, encontramos, pela 
Equação (12.87), 

Pi(x) = P, + 2P} = z + 22 = 3x, 


da qual resulta a segunda linha da Tabela 12.2, 3 cos sen 0, por multiplicação por sen 6. Para s = 2 obtemos 


(3x? — 1) + 6a? de qe 


Ps(x) = Po + 2xP3 — Pi = 5 a 


N| = 


de acordo com a linha 4 da Tabela 12.2. Para obter a linha 3, usamos a Equação (12.88). Para m = 1, s = 0, ela dá 
P2 (x) = 3P} (x) = 3, e multiplicar por 1 — x? = sen20 reproduz a linha 3 da Tabela 12.2. Para as linhas 5, 8, 9, 
a Equação (12.84) pode ser usada, o que deixamos como exercício. Generalizando, usamos a Equação (12.89) em 
vez da Equação (12.87) para obter um valor de partida de P? . Então, a Equação (12.85) se reduz a uma fórmula 
de dois termos para P, dando (2m — 1)!!. Note que, se m = 0, isto é, (—1)!! = 1. > 
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Exemplo 12.5.2 VALORES ESPECIAIS 


Para x = 1, usamos 


2\—-m-—1/2 o —2m—1 _ > —2m-—1 s 
(1-2t+2) =(1-t) ->( y ): 
na Equação (12.84) e achamos 
2m)! / —2m — 
esa e ( EA De (12.90) 


em que 


para s = 0e 


para s > 1. Para m = 1, s = 0, temos Pi (1) = EA = 1; para s = 1, P4(1) = —() = 3 paras = 2, 
PDS {TNE aa = 6 = ł(5 — 1), todos de acordo com a Tabela 12.12. Para x = 0, também podemos 
usar a expansão binomial, o que deixamos como exercício. = 


Relações de Recorrência 
Como esperado e já visto, as funções associadas de Legendre satisfazem relações de recorrência. Por causa da 
existência de dois índices em vez de apenas um, temos uma ampla variedade de relações de recorrência: 


2ma 


prt apo + [n(n + 1) — m(m — 1)| Pt = 0, (12.91) 
(2n + 1) PR = (n + m)Pr i + (n-m ++ DP (12.92) 


(2n + 1)(1 pre pe ap 


n+1 
= (n+m(n+m-— PR! 
—-(n=m+1)(n-m +2) P7", (12.93) 
+ 1 1 
(1-2?) pr = SE r (12.94) 


Essas relações, e muitas outras similares, podem ser verificadas pela utilização da função geradora 
(Equação (12.4)), por substituição da solução de série da equação associada de Legendre (12.79) ou por redução 
das relações de recorrência do polinômio de Legendre, usando a Equação (12.73c). Como exemplo do último 
método, considere a Equação (12.93). Ela é similar à Equação (12.23): 


(2n + 1)Pa(£) = P! (£) — P} _ (2). (12.95) 


Vamos diferenciar essa relação de recorrência de polinômios de Legendre m vezes para obter 


d™ d™ d” 
(en + 1) m Palo) = um ane) ma aale) 
dqr+ dart 


Agora, multiplicando por (1 — «x2)("+1)/2 e usando a definição de P,(x), obtemos a primeira parte da 
Equação (12.93). 
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Paridade 


A relação de paridade satisfeita pelas funções associadas de Legendre pode ser determinada por exame da Equação 
definidora (12.73c). Quando x — —«:, já sabemos que P, (x) contribui com um (— 1)”. A diferenciação m vezes 
resulta em um fator (—1)™. Por conseguinte, temos 


P? (=r) = ("PP (x). (12.97) 


Um rápido exame da Tabela 12.2 verifica isso para 1 < m < n < 4. 
Além do mais, pela definição na Equação (12.73c), 


PAD) =0, formzo. (12.98) 


Ortogonalidade 
A ortogonalidade dos P?” (a) resulta da EDO, exatamente como para os P, (x) (Seção (12.3)), se m for o mesmo 
para ambas as funções. Contudo, é instrutivo demonstrar a ortogonalidade por outro método, um método que 
também dará a constante de normalização. 

Usando a definição na Equação (12.73c) e a fórmula de Rodrigues (Equação (12.65)) para P, (a), achamos 


Nm 1 p+m q+m 
forro JP (a) da = E fora xe) a X4 de. (12.99) 


2P+aplq! dxr+t™m dxaıt™m 


A função X é dada por X = (x? — 1). Se p Æ q, vamos admitir que p < q. Note que o índice superior m é 
o mesmo para ambas as funções. Essa é uma condição essencial. A técnica é integrar repetidas vezes por partes; 
todas as partes integradas desaparecerão, contanto que haja um fator X = x? — 1. Vamos integrar q + m vezes 
para obter 


1 ml +m 1 +m +m 
/ Pr (a) PP (a) dz = o | ga (x” E x) de. (12.100) 
“i 


2º+4 pla! dastm dap+m 


O integrando do lado direito agora é expandido pela fórmula de Leibniz para resultar em 


q+m p+-m 
X4 q o É x”) 


dxat™m dar+m 
q+m o - 
ais m)! drtm i dprtm+i 
= X41 X” | —— X”. 12.101 
H i!( a (se ż Ji ( ) 


Uma vez que o termo X” não contém nenhuma potência de x maior do que 2”, devemos ter 


q+tm-—i< 2m (12.102) 
ou a derivada se anulará. De modo semelhante, 
p+m+i<2p. (12.103) 
Adicionar ambas as desigualdades resulta em 
q<p, (12.104) 


o que contradiz nossa suposição de que p < q. Por conseguinte, não há nenhuma solução para i e a integral se 
anula. Obviamente, obteremos o mesmo resultado se p > q. 

Para o caso remanescente, p = q, temos o termo único correspondente a à = q—m. Inserindo a Equação (12.101) 
na Equação (12.100), temos 


1 2m 1 2m 2 
2 (Dr(a + m)! | d d? 
Pr da = X4 X” Xº | dz. 121 
Ji q (a)] de 221 g!g(2m)(g— m)! Jı dam dx?4 E ad) 
Visto que 
X” = (x? — 1)” =g me M, (12.106) 
d2m 

x" = (2m)!, (12.107) 
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a Equação (12.105) se reduz a 


I 2 =jrm ! m)! f! 
feria) amet em É f xras (12.108) 


A integral da direita é exatamente 
(=1)º f sen24t!9 do = (21924 ata! 
0 (2q + 1)! 


(compare com o Exercício 8.4.9). Combinando as Equações (12.108) e (12.109), temos a integral de 
ortogonalidade, 


(12.109) 


1 
2 (g + m)! 
P(x) P? (x) de = . O pai 12.110 
a p (e) Pa (e) 2q+1 (g-m)! ” i l 
ou, em coordenadas polares esféricas, 
2 (g + m)! 


1 P3” (cos 0) PY (cos 0)sen O do = (12.111) 


2441 (gm! PU 

A ortogonalidade dos polinômios de Legendre é um caso especial desse resultado, obtido igualando m a zero, 
isto é, para m = 0, a Equação (12.110) se reduz às Equações (12.47) e (12.48). Em ambas as Equações (12.110) e 
(12.111), nossa teoria de Sturm-Liouville do Capítulo 10 poderia fornecer o delta de Kronecker. Para a constante 
de normalização é preciso um cálculo especial, tal como a análise que fizemos aqui. 

A ortogonalidade das funções associadas de Legendre no mesmo intervalo e com o mesmo fator de ponderação 
dos polinômios de Legendre não contradiz a unicidade da construção de Gram-Schmidt dos polinômios de 
Legendre, Exemplo 10.3.1. A Tabela 12.1 sugere (e a Seção (12.4) comprova) que fo Po (x) P7 (x) da pode 
ser escrita como 


1 
m m anne 
a Py (<) Pi (£)(1— x°)" dz, 

em que definimos antes 

m m/2 m 

Pi (a) (1 — z?) = Pp (x). 
As funções PoC) podem ser construídas pelo procedimento de Gram-Schmidt com a função de peso w(x) = 
(1— 2)”, 
É possível desenvolver uma relação de ortogonalidade para funções associadas de Legendre que tenham o 

mesmo índice inferior, mas índice superior diferente. Encontramos 


1 

/ Pr(o)PMa)(1- 22) de= gi a (12.112) 
e m(n — m!) 

Observe que foi introduzido um novo fator de peso (1 — x2)-1. Essa relação é uma curiosidade matemática. Em 

problemas físicos com soluções de simetria esférica das Equações (12.80) e (9.64), aparece em conjunção com 

as da Equação (9.61), e a ortogonalidade da dependência azimutal faz com que os dois índices superiores fiquem 

iguais e sempre leva à Equação (12.111). 


Exemplo 12.5.3 | campo DE INDUÇÃO MAGNÉTICA DE UM CIRCUITO DE CORRENTE 

Como as outras EDOs da Física Matemática, é provável que a equação associada de Legendre apareça quando 
menos se espera. Como ilustração, considere o campo de indução magnética B e o potencial vetorial magnético A 
criado por um único circuito de corrente circular no plano equatorial (Figura 12.12). 


Pela teoria eletromagnética sabemos que a contribuição do elemento de corrente J dA ao potencial vetorial 
magnético é 
to I dA 
4 r` 
(Isso resulta do Exercício 1.14.4 e Seção 9.7.) A Equação (12.113), mais a simetria de nosso sistema, mostra que 
A tem somente uma componente (> e que a componente é independente de y, 


A = Aplr, 0). (12.114) 


dA = (12.113) 


1TFaça pares de elementos de corrente correspondentes Id A (91) e Id A (p2), onde Y — py = p2 — Y. 
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Figura 12.12: Circuito fechado de corrente circular. 


Pelas equações de Maxwell, 


D 
VxH=J, = 0 (unidades SI ). (12.115) 
Uma vez que 
HoH = B = V xA, (12.116) 
temos 
V x(V xA) = uoJ, (12.117) 


em que J é a densidade de corrente. Em nosso problema J é zero em todos os lugares, exceto no circuito fechado 
de corrente. Por conseguinte, longe do circuito, 


V x V x pA,(r,0)=0, (12.118) 
usando a Equação (12.114). 
Pela expressão para a espiral em coordenadas polares esféricas (Seção 2.5), obtemos (Exemplo 2.5.2) 


A, 204, 18A, 10 


V x |V x ĝAp(r,0)] = E a GR aê -3 Do C 04) 
=0. (12.119) 
Fazendo A (r, 0) = R(r)©(0) e separando variáveis, temos 
ËR .dR 
200 —— — = 
Po t2 n(nADR=O, (12.120) 
dO do 


A segunda equação é a equação associada de Legendre (12.80) com m = 1, e podemos escrever imediatamente 
O(0) = P! (cos 0). (12.122) 


A constante de separação n(n + 1), sendo n um inteiro não-negativo, foi escolhida para manter essa solução 
bem-comportada. 

Por tentativa, fazendo R(r) = r“, constatamos que « = n ou —n — 1. A primeira possibilidade é descartada, 
porque nossa solução deve se anular à medida que r — oo. Por conseguinte, 


bn n+1 
Apn = —— P! (cos 0) = cn (=) Pi(cos 0) (12.123) 


pn 


oo n+1 
Adr) = Y> cn (=) Pi(cos0) (r>a). (12.124) 
1 
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Aqui, a é o raio do circuito de corrente. 
Uma vez que A, deve ser invariante à reflexão no plano equatorial, pela simetria de nosso problema 


Aplr,cos0) = Ay (r, — cos 6), (12.125) 


a propriedade de paridade de P?” (cos 0) (Equação (12.97)) mostra que cn = 0, para n par. 

Para concluir a avaliação das constantes, podemos usar a Equação (12.124) para calcular B, ao longo do eixo z 
(B; = B,(r,0 = 0)) e comparar com a expressão obtida da lei de Biot-Savart. Essa é a mesma técnica usada no 
Exemplo 12.3.3. Temos (compare com a Equação (2.47)) 


1 o cotg 0 104 
B, = A| = — | = 04,)| = A z 12.12 
Y | rsen 0 E (sem o) q CP E 96 ( o 
Usando IPH ) 7 j ( ) 
P, (cos 0 dP, (cos 6 1 n(n+1 
z = 9— =-= P? E 12.127 
96 EE d(cos 0) 2 e $ 2 Š ( ) 
(Equação (12.94)) e então a Equação (12.91) com m = 1, 
2 a! 
P2(cos6) — “SOS pr (cos 9) + n(n + 1)P, (cos 0) = 0, (12.128) 
obtemos 
OR; n+1 
a 
B,(r,0) = > Cnn(n + 1) R P, (cos 0), r>a, (12.129) 
(para todo 0). Em particular, para 0 = 0, 
99. art! 
B,(r,0) = a Da (12.130) 
Também podemos obter 
LO(rA — o art 
Bo(r,0) = —— Ao) - DO enn qaça Palcos) r>a, (12.131) 
A lei de Biot-Savart afirma que 
d E 
ro e (12.132) 
Ar 72 


Agora integramos sobre o perímetro de nosso circuito fechado (raio a). A geometria é mostrada na Figura 12.13. 
O campo de indução magnética resultante é ZB.,, ao longo do eixo z, com 
-3/2 
Mol 2p 2, „278/2 _ Hola a? 
B=- (a? + 2º) RS a : (12.133) 


Expandindo pelo teorema binomial, obtemos 


gü 28 
Hol a? (2s+D!/a 

= 1 ; 12.134 
A D am oa 2>a (12.134) 

Igualando as Equações (12.130) e (12.134) termo por termo (com r = A Pai encontramos 

I I 
ci= o co= HE, co=u=:=0 ao 
I 2)! ` 
RE (= 1)(-D/2 Ho . (n/2) n ímpar. 


In(n+ 1 Tn — 1/20)! 


18A série descendente de potências também é única. 
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dB (para fora do papel) 


Idk 


Figura 12.13: Lei de Biot-Savart aplicada a um circuito circular. 


De modo equivalente, podemos escrever 


canti = (D"am an+ CU qn de de 
e 
A 2 o A 2n 
Ao(r,0) = (=) cme( E) Pł„ 41 (c08 0), (12.137) 
n=0 
a? oo a 2n 
B,(r,0) = a 5 Canyi(2n + 1) (2n + 2) (=) Ponwi(cos 0), (12.138) 
n=0 
a2 [ese] a 2n 
Bo(r,0) = 3 5 Cmn41 (20 + 1) (=) Pł„ņ1 (C080). (12.139) 
n=0 


Esses campos podem ser descritos em forma fechada pela utilização de integrais elípticas. O Exercício 5.8.4 é 
uma ilustração dessa abordagem. Uma terceira possibilidade é integração direta da Equação (12.113) por expansão 
do denominador da integral para A, no Exercício 5.8.4 como uma função geradora de polinômios de Legendre. 
A corrente é especificada por funções delta de Dirac. Esses métodos têm a vantagem de dar as constantes Cn 
diretamente. 

Uma comparação entre campos magnéticos de dipolo de circuito de corrente e campos de dipolo elétrico finitos 
pode ser interessante. Para o dipolo magnético de circuito de corrente, a análise precedente resulta em 


2 r3 2 


Lol a? 3 aN? 
Bo(r,0) = i a [Pi (2) P+, (12.141) 


2 2 
PE pao P: (2) B+], (12.140) 
r 
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Pelo potencial de dipolo elétrico finito da Seção (12.1), temos 
a a? 
E,(r,0) = É, [P +2(2) Bt), (12.142) 
TEOT r 
2 
qa 1 a 1 
Eo(r,0) = —— |P. —) PRBtl. 12.143 
e(r, 0) l 1+ (2) T | ( ) 


Os dois campos concordam na forma até em que está em questão o termo líder (r7? P}), e isso é a base para chamar 
ambos de campos de dipolo. 

Como no caso de multipolos elétricos, às vezes é conveniente discutir multipolos magnéticos pontuais (veja a 
Figura 12.14). Para o caso do dipolo, Equações (12.140) e (12.141), o dipolo pontual é formado considerando o 
limite a > 0,1 — co, mantendo Ta? constante. Sendo n um vetor unitário normal ao circuito de corrente (sentido 


positivo pela regra da mão direita, Seção 1.10), o momento magnético m é dado por m = n/a. E 
(1 0, p) 
Z 
—a a 


Figura 12.14: Dipolo elétrico. 


Exercícios 


12.5.1 


12.5.2 


12.5.3 


12.5.4 


Prove que 


n+m 
proc E fuso (ra 


Sugestão: Uma abordagem é aplicar a fórmula de Leibniz a (x + 1)” (x — 1)”. 


Mostre que 


E (0) = 0, 


ENSE T E Tr 


por cada um desses três métodos: 
(a) utilização de relações de recorrência, 
(b) expansão da função geradora, 
(c) Fórmula de Rodrigues. 
Avalie P (0). 
(n+m)! 
2"((n — m)/2)((n + m)/2)' 


_1)(n=m)/2 
Resposta: P™ (0) = (S 


0, 
Além disso, P™ (0) = (-1)0-m/2L ami 
Mostre que 
P” (cos 0) = (2n — 1)!!sen”0, n=0,1,2,... 


n+m-1)! 


n + m par, 


n + m ímpar. 
| 
n +m par. 
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12.5.5 


12.5.6 


12.5.7 


12.5.8 


12.5.9 


12.5.10 


12.5.11 


12.5.12 


Derive a relação de recorrência associada de Legendre 


2MT 


m+1 ne m 
P (x) (1 -g2tn 


(a) + [n(n +1) - m(m - 1)] PY- (a) =0. 


Desenvolva uma relação de recorrência que dará P}(x) como 
Pala) = fi(a,n) Pol) + fa(a,n)Proi(a). 
Siga ou (a) ou (b). 
(a) Derive a relação de recorrência da forma precedente. Dê fı (x, n) e fo(x,n) explicitamente. 
(b) Ache a relação de recorrência adequada na literatura. 


(1) Dê a fonte. 
(2) Verifique a relação de recorrência. 


ana na n 
Resposta: P, (x) a pyan + a agia. 
Mostre que 
d 1 
sen O cos p E nlcos 0) = P, (cos 6). 
Mostre que 
PEdP do -me PEPR 2n(n + DD (n+m)! 
n n! y n n 0 d E ni 
(8) f ( do do sen20 )sen SEE ARROIO 


T/ P} dP} P} dP} 
b n r y z 0 do = 0. 
(b) f (G do sen 0 dô Jen 


Essas integrais ocorrem na teoria do espalhamento de ondas eletromagnéticas por esferas. 
Como repetição do Exercício 12.3.10, mostre, usando funções associadas de Legendre, que 


1 
+1 2 n! 
1— zê) P' (æ) P! (x) de = 2. l Öman 
fal x’) n (2) n (2) T 2n+1 2n-1 (n=2)! n—1 
2 2)! 
fa (ha toi 


n+1 2n4+3 n! 
Avalie A 
J sen? P} (cos 0) do. 
0 


O polinômio associado de Legendre P?” (x) satisfaz a EDO auto-adjunta 


d? Pr (x) dP? (x) m? A 
(1— a?) Aê 2x E + In(n + 1) — ER P”(x)=0. 


Pelas equações diferenciais para P” (x) e Pk (x), mostre que 


1 PP (2) Pta) E = 0, 


1 — z2 


para k £ m. 

Determine o potencial vetorial de um quadrupolo magnético diferenciando o potencial do dipolo 

magnético. 

Pi(cos0 

SEN + termos de ordem mais alta. 
r 


pE di 0) E ji (E 0) ! 
r 


Resposta: A mQ = a (Ta?) (dz) 


Bmo = uo (Ia’) (dz) 


Isso corresponde a colocar um circuito fechado de corrente de raio a em z — dz e um circuito 
fechado de corrente diretamente oposto em z — —dz e fazendo a — O sujeito a (dz)a (força do 
dipolo) ser igual à constante. 


r 


Uma outra abordagem desse problema seria integrar dA (Equação (12.113), expandir o 
denominador em uma série de polinômios de Legendre, e usar o teorema da adição de polinômios 
de Legendre (Seção 12.8). 
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12.5.13 


12.5.14 


12.5.15 


12.5.16 


12.5.17 


12.5.18 


Um único circuito fechado de fio elétrico de raio a transporta uma corrente constante T. 


(a) Ache a indução magnética B parar < a, 0 = 7/2. 
(b) Calcule a integral do fluxo magnético (B - do) sobre a área do circuito fechado de corrente, 


isto é, 
a 27 pe 
j: 1 B,(r,0= 5 dorar. 
o Jo 2 


A Terra está dentro de uma corrente anelar desse tipo, na qual I se aproxima de milhões de ampères 
que surgem da deriva de partículas carregadas no cinturão de van Allen. 


Resposta: oo. 


(a) Mostre que no limite do dipolo pontual o campo de indução magnética do circuito fechado de 
corrente se torna 


B,(r,0) = 5 TP (cos 0), 


Bo(r,0) = 5e TE Pi (cos 0) 


com m = Iraí, 

(b) Compare esses resultados com a indução magnética do dipolo magnético pontual do Exercício 
1.8.17. Considere m = Zm. 

Uma casca esférica uniformemente carregada está girando com velocidade angular constante. 

(a) Calcule a indução magnética B ao longo do eixo de rotação fora da esfera. 

(b Usando a série de potencial vetorial da Seção (12.5), ache A e então B para todo o espaço fora 
da esfera. 


No modelo da gota de líquido do núcleo, o núcleo é sujeito a pequenas deformações. Considere 
uma esfera de raio ro que é deformada de modo que sua nova superfície seja dada por 


r= ro [1 + as Po(cos O)|. 


Ache a área da esfera deformada para termos de ordem aå. 


Sugestão: 
dr\ 271/2 
dA = b? + (55) | rsen 0 d0 dy. 


Resposta: A = 4nrê [1 + $03 + O(a3)]. 


Nota: O elemento de área dA resulta de observar que o elemento de linha ds para «o fixo é dado por 


2492 2) 1/2 2 dr? R 
ds = (r do + dr?) = [rº+ 7) dð. 


Uma partícula nuclear está em um poço de potencial quadrado esférico V(r,0,p) = O para 
0<r<aeooparar > a. A partícula é descrita por uma função de onda y(r, 0, p) que satisfaz a 
equação de onda 


h2 
-zy V V + Voy = Ey, r<a, 


e a condição de contorno 
y(r =a) = 0. 


Mostre que, para a energia E ser um mínimo, é preciso que não haja nenhuma dependência angular 

na função de onda; isto é, Y = y(r). 

Sugestão: O problema está centrado na condição de contorno imposta à função radial. 

(a) Escreva uma sub-rotina para calcular o valor numérico da função associada de Legendre P} (x) 
para valores dados de N e x. 
Sugestão: Com as formas conhecidas de P} e Pi, você pode usar a relação de recorrência, 
Equação (12.92) para gerar P}, N > 2. 
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(b) Verifique sua sub-rotina calculando P} (x) para x = 0,0(0,5) 1,0 e N = 1(1)10. Compare 
esses valores numéricos com os valores conhecidos de P} (0) e P} (1)) e com os valores 


tabulados de P} (0,5). 
12.5.19 Calcule o potencial vetorial magnético de um circuito fechado de corrente, Exemplo 12.5.1. Tabule 
seus resultados para r/a = 1,5(0,5)5,0 e O = 0º(15º)90º. Inclua termos na expansão de série, 
Equação (12.137), até que os valores absolutos dos termos fiquem abaixo do termo líder por um 
fator de 10º ou mais. 
Nota: Essa expansão associada de Legendre pode ser verificada por comparação com a solução de 
integral elíptica, Exercício 5.8.4. 
Valor de verificação. Para r/a = 4,0 e 0 = 20º, 
Aç/tHol = 4,9398 x 1073. 


12.6 Harmônicos Esféricos 


Na separação de variáveis da (1) equação de Laplace, (2) equação de Helmholtz ou dependência do espaço da 
equação de onda eletromagnética e (3) equação de onda de Schrödinger para campos de força centrais, 


V? +k’ firj =0, (12.144) 


a dependência angular, que vem inteiramente do operador laplaciano, é!” 


(y) d dO (0) d(e) 
— | sen 0 
sen 0 d0 do sen20 dy? 


+ n(n + 1)O(9)6(9) = 0. (12.145) 


Dependência Azimutal — Ortogonalidade 
A equação azimutal separada é 


1 do: 
(2) = -m?, (12.146) 
Pp) dp 
com soluções 
Bly) =e, are, (12.147) 
com m inteiro, o que satisfaz a condição ortogonal 
2T . f 
e AR e MAP dy = DTO irii (12.148) 
0 


Note que o produto tomado é $7, (y)Bm,() e que * é usado para indicar a função complexa conjugada. Essa 
troca não é exigida, mas é conveniente para cálculos de Mecânica Quântica. Poderíamos ter usado 


P = sen my, cos my (12.149) 


e as condições de ortogonalidade que formam a base para a série de Fourier (Capítulo 14). Para aplicações como 
as que descrevem o campo gravitacional ou magnético da Terra, sen mọ e cos my seriam a opção preferida (veja 
o Exemplo 12.6.1). 

Em problemas eletrostáticos e em muitos outros problemas físicos, exigimos que m seja um inteiro de modo 
que (Y) seja uma função de valor único do ângulo de azimute. Em Mecânica Quântica a questão é muito mais 
complicada: compare com a nota de rodapé na Seção 9.3. 

Por meio da Equação (12.148), 


cimo (12.150) 


é ortonormal (ortogonal e normalizado) com relação à integração sobre o ângulo de azimute g. 


19Para uma constante de separação da forma n(n + 1) sendo n inteiro, a solução de série da equação de Legendre se torna um polinômio. 
Quanto ao mais, ambas as soluções de série divergem (Exercício 9.5.5). 
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Dependência do Angulo Polar 

Subdividindo a dependência azimutal, a dependência do ângulo polar (0) leva à equação associada de Legendre 
(12.80), que é satisfeita pelas funções associadas de Legendre; isto é, O(0) = P™ (cos 0). Para incluir valores 
negativos de m, usamos a fórmula de Rodrigues, Equação (12.65), na definição de P™ (cos 0). Isso leva a 


damn 


1- dad 


P” (cos 0) = (x? -1)”,  —-n<m<n. (12.151) 


si ( dona 


P™ (cos 0) e P; ™ (cos 8) estão relacionados como indicado no Exercício 12.5.1. Uma vantagem dessa abordagem 
sobre simplesmente definir P?(cos 0) para 0 < m < n e impor que PT” = P™ é que as relações de recorrência 
válidas para 0 < m < n continuam válidas para -n < m < 0. 

Normalizando a função associada de Legendre pela Equação (12.110), obtemos as funções ortonormais 


2n+1(n-m)! 
2 (n+m)! 


P? (cosb), -n<m<n, (12.152) 


que são ortonormais com relação ao ângulo polar 0. 


Harmônicos esféricos 
A função DB, (7) (Equação (12.150)) é ortonormal com relação ao ângulo azimutal y. Consideramos o produto de 
Ëm (y) e a função ortonormal em ângulo polar da Equação (12.152) e definimos 


Y” (0,9) = (1%) mi : E - s P (cos O)eime (12.153) 


para obter funções de dois ângulos (e dois índices) que são ortonormais sobre a superfície esférica. Esses 
Y7"(0,4) são harmônicos esféricos dos quais alguns dos primeiros estão plotados na Figura 12.15. A integral 
de ortogonalidade completa se torna 


27 T 
/ 1 VT (0, JY; (0, p)sen O dO dp = ônina mimo (12.154) 
(Ea) 9=0 


=0 

O (—1)” extra incluído na equação definidora de Y” (0, p) merece alguns comentários. Ele é claramente legítimo, 

uma vez que a Equação (12.144) é linear e homogênea. Ele não é necessário, mas, quando passamos para certos 

cálculos de Mecânica Quântica, em particular a teoria quântica do momento angular (Seção (12.7), é muito 

conveniente. O fator (— 1)” é um fator de fase, muitas vezes denominado fase de Condon-Shortley, nome que 

se deve aos autores de um texto clássico sobre espectroscopia atômica. O efeito desse (—1)” (Equação (12.153)) 

e do (—1)” da Equação (12.73c) para P7 ™ (cos 0) é introduzir uma alternância de sinal entre os harmônicos 
esféricos positivos m mostrados na Tabela 12.3. 

As funções Y” (0, p) ganharam o nome harmônicos esféricos primeiro porque são definidas sobre a superfície 

de uma esfera com ângulo polar 0 e azimute y. O harmônico foi incluído porque as soluções da equação de 


Laplace eram denominadas funções harmônicas e Y,” (cos 0, p) é a parte angular de tal solução. 
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Figura 12.15: [RY” (0,9) para 0 < L < 3,m = 0,...,3. 


Tabela 12.3 Harmônicos esféricos (Fase de Condon-Shortley) 


I 
Y (0, p)= Var 
3 
Y (0, q) = — Er sende'? 
0 3 
Y (0,9) = 7A cos 0 
>i 3 
Yy (0,)=+ z” de 
2 5 20 2i 
Y(0,9) = Da Se de 
i 5 
Y (0,9) = — TE — 3sen 0 cos bet? 
5/3 
Y? (0, p) = n cos? 0 — ) 


zap s” 6 cos Be '? 


Y> Vo ? 967 3sen20 


Na estrutura da Mecânica Quântica a Equação RR se torna uma equação de momento angular orbital e a 


s$ 
S 
T 
+ 
PE 
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solução YZ (0, p) (n substituído por L, m substituído por M) é uma autofunção de momento angular, sendo L o 
número quântico de momento angular e M a projeção de L sobre o eixo z. Essas relações são desenvolvidas com 
mais detalhes nas Seções 4.3 e 12.7. 


Séries de Laplace, Teorema da Expansão 
Parte da importância dos harmônicos esféricos está na propriedade de completude, uma conseqiiência da forma de 
Sturm-Liouville da equação de Laplace. Nesse caso, essa propriedade significa que qualquer função f (0, p) (com 


propriedades de continuidade suficientes) avaliada sobre a superfície da esfera pode ser expandida em uma série 
dupla uniformemente convergente de harmônicos esféricos?” (série de Laplace): 


FO, p) =D amna Yx (0,9). (12.155) 


Se f(0, p) for conhecida, os coeficientes podem ser encontrados imediatamente pela utilização da integral de 
ortogonalidade. 


Tabela 12.4. Coeficientes de campo de gravidade, Equação (12.156) 


Coeficiente” Terra Lua Marte 

C20 1,083 x 1078 (0,200 + 0,002) x 1073 (1,96 0,01) x 1078 
C99 0,16 x 1075 (2,4 0,5) x 1075 (—5 1) x 1075 
S22 —0, 09 x 1075 (0,5 + 0.6) x 1075 (31) x 105º 


“Co0 representa uma protuberância equatorial, enquanto C22 e S22 representam uma dependência 
azimutal do campo gravitacional. 


Exemplo 12.6.1 SÉRIE DE LAPLACE SÉRIE — CAMPOS DE GRAVIDADE 


Os campos de gravidade da Terra, da Lua e de Marte foram descritos por uma série de Laplace com autofunções 
reais: 


GM|R S&R] 
U(r,0, p) E R y z 5 5 (5) Onm Y n0; p) + Sam mn lð, p)} $ (12.156) 


n=2m=0 


$ ; PED $ z itze dus ; 
Aqui, M é a massa do corpo e R é o raio equatorial. As funções reais Y 2, e Yom São definidas por 


Yin(0,9) = Picos) cosmy,  Ymn(0, p) = Pa (cos 0)sen mo. 


Para aplicações como essa, as formas trigonométricas reais são preferidas à forma exponencial imaginária de 


YM (0, p). Medições por satélite levaram aos valores numéricos mostrados na Tabela 12.4. E 
Exercícios 
12.6.1 Mostre que a paridade de Y (0, p) é (—1)L. Observe o desaparecimento de qualquer dependência 
de M. 


Sugestão: Para a operação de paridade em coordenadas polares esféricas, veja o Exercício 2.5.8 e a 
nota de rodapé 77 na Seção 12.2. 


12.6.2 Prove que 


2L +1\ 1? 
Y (0,9) = ( 47 ) ôM,o: 


12.6.3 Na teoria da excitação de núcleos de Coulomb encontramos YM (x /2, 0). Mostre que 
yM (T o) = (LH PIE MULA MY? rena 
LZ J Ad (L—-M)!(L +M)! 
=0 para L + M ímpar. 


para L + M par, 


Aqui 


(2n)!! = 2n(2n — 2) ---6-4- 2, 
(2n +1)! = (2n +1)(2n —1)---5-3-1. 


20Para uma prova desse teorema fundamental, veja E. W. Hobson, The Theory of Spherical and Ellipsoidal Harmonics, Nova York: Chelsea 
(1955), Capítulo VII. Se f (0, p) for descontínua, ainda podemos ter convergência na média, Seção 10.4. 


ELSEVIER 
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12.6.4 


12.6.5 


12.6.6 


12.6.7 


12.6.8 


12.6.9 


(a) Expresse os elementos do tensor de momento de quadrupolo x;x; como uma combinação linear 
dos harmônicos esféricos Y>” (e Vo): 
Nota: O tensor x;x; é redutível. O YE indica a presença de uma componente escalar. 

(b) O tensor de momento de quadrupolo costuma ser definido como 


Qi; = fria; — r26;;) p(r) dr, 


sendo p(r) a densidade de carga. Expresse as componentes de (3x;xj — r20;;) em termos de 
r2 YM, 

(c) Qual á a significância do termo —r26;;? 
Sugestão: Compare com as Seções 2.9 e 4.4. 


As funções azimutais ortogonais dão uma representação útil da função delta de Dirac. Mostre que 


OO 


se explim(yy = pə): 


m= — oo 


1 


ôlpi — Po) = pym 


Derive a relação de fechamento de harmônico esférico 


OO 


+l 
DS Woo)” (02, 92) = 


l=0 m=—l 


sen 04 9(01 — 05)6(P4 — P2) 


= (cos ĝı — cos 02) (Y1 — 5). 


Os operadores de momento angular da Mecânica Quântica L, + iL,, são dados por 


0 dy 


ol O o 
i e A ; 
Ly — ily e (5 icotg 15). 


Ls +ily= “(2 + icotg Z), 


Mostre que 
(a) (La + iLy)YL (0, p) = V (L - MILA M + YZ (0,9), 


(b) (Le — iLy)Yp (0, p) = V(L + M)(L-— M + YO, 9). 
Com L+ dado por 


TAIE, o 
: ad RO aro 
L+ = Lz ily = e [5 + icotg TAi 

mostre que 

Ti (l + m)! l-my/l 
(a) Y = ENT mi Y, 

m (l Ta m)! ltmy — 
(b) y” = CNE mi (D+) Y. 


Em algumas circunstâncias é desejável substituir a exponencial imaginária de nosso harmônico 
esférico por seno ou co-seno. Morse e Feshbach (veja Referências Gerais no final do livro) definem 


Yin = Pr (cos 0) cos mo, 


Yin = P7 (cos 0)sen my, 
em que 


27 T 
A 2 Ar è (n+m)! 
V º(0 8 do dp = e 
f Lee (0, p)] sen 0 do dy oem AR 


= 4r para n = 0 (Yoo é indefinida.) 
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Esses harmônicos esféricos costumam ser denominados de acordo com os padrões de suas regiões 
positiva e negativa sobre a superfície de uma esfera — harmônicos zonais para m = 0, harmônicos 
setoriais para m = n, e harmônicos tesserais para 0 < m < n. Para Y$, n = 4, m = 0,2,4, 


mn? 


indicam em um diagrama de um hemisfério (um diagrama para cada harmônico esférico) as regiões 
nas quais o harmônico esférico é positivo. 


12.6.10 Uma função f(r, 8, p) pode ser expressa como uma série de Laplace 
Fr, 0, p) = 5 amr Y” (0, p). 
l,m 


Usando ()estera para representar a média (com centro na origem), mostre que 
(Fr, 0, P) Y ostora = f(0,0,0). 
12.7 Operadores de Momento Angular Orbital 


Agora voltamos aos operadores de momento angular orbital específicos Ly, Ly e L, da Mecânica Quântica 
introduzidos na Seção 4.3. A Equação (4.68) se torna 


Lbru(d,7) = MyYrml0, p), 


e queremos mostrar que 
Vrm(O, p) = YE (9,9) 

são as autofunções | LM) de L? e L,, da Seção 4.3 em coordenadas polares esféricas, os harmônicos esféricos. A 
forma explícita de L, = —ið /ðp do Exercício 2.5.13 indica que 1) ; y tem uma dependência de y de exp(iM p) — 
sendo M um inteiro para manter 1); y como função de valor único. Além disso, se M for inteiro, então L também 
é inteiro. 

Para determinar a dependência de 0 de Yz (9, p), passamos por duas etapas: (1) a determinação de Y% z z (0, p) 
e (2) o desenvolvimento de Yz ny (9, p) em termos de Yz r, sendo a fase fixada por yo. Seja 


Yru(8, p) = Oru(9)eMº. (12.157) 


Por L, rr = 0, sendo L o maior M, usando a forma de L, dada nos Exercícios 2.5.14 e 12.6.7, temos 


elte 5 — Lcotg J O11(0) =0, (12.158) 
e assim 
yr1(0,9) = csent bett? (12.159) 
Normalizando, obtemos 
27 T 
er f J sen?™t19 dO dy = 1. (12.160) 
0 0 


A integral 0 pode ser avaliada como uma função beta (Exercício 8.4.9) e 


2L+1)!! (2L)! [2L+1 
abad eD yA (12.161) 
4AT (2L)!! 2L L! 4T 
Isso conclui nossa primeira etapa. 


Para obter a Yrm, M + +L, voltamos aos operadores de levantamento e de abaixamento. Pelas 
Equações (4.83) e (4.84) e como mostrado no Exercício 12.7.2 (J, substituído por L, e J— substituído por 
Lo), 


bimo) = rap E r), 


(12.162) 


Yrm(ô,9) = OA (L4) dr,- p). 


CLL +M) 
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Mais uma vez, observe que as fases relativas são estabelecidas pelos operadores de levantamento e de abaixamento. 


L, e L. operando sobre O, m (0)e’™? podem ser escritos como 


L,Orm(0)e'Me = AMD È — Mcotg j Ozm(0) 


d 
1+M q -M 9 
d(cos o Orm(®), 


eAM+Desen 


L Orm(0)e'Mº = expo È + Mcotg j Ozm(0) 


— AM -Desenl-Mg sen” Oz m (0). 


d 
d(cos 8) 
Repetir essas operações n vezes resulta em 


; atu 
(L,)"Oru(0)e'M? = (APM mesennt Mal sen Orm(0) 


d(cos 0)” í 
; ; d”sen™ 0O zm (0) 
LM 0 iM — (M-n)p n=M LM 
(L-)"Ozm(0)e e sen dlcos 0)” 
Pela Equação (12.162), 
(L +M)! M an -M diom 2L 
0,9) = SA 0 0 
Pinto) = e ME e O e a S 
e para M = — L: 
2L 
_ CL iLp. L 2L 
Vr -L0 p) = QIN? sen Ee s027 en^“ 0 


= (—1)”crsen” 0e7 "LP. 
Note a fase característica (—1)” de Yz 1 relativa a q); z. Esse (—1)*” entra por 
sen?” 0 = (1 — 22)” = (—1)2 (x? — 1)”. 
Combinando as Equações (12.162), (12.163) e (12.166), obtemos 


dM sen?t 9 
d(cos 6)L+M ` 


(L— M)! 


Yrmlð, p) = (—1)2er CIL + Mt 1) TM eiM Psen™ q 


As Equações (12.165) e (12.168) estão de acordo se 
1 dt 
YLo(9,9) = sen?6. 


VCL]! (dcos 0) 


Usando a fórmula de Rodrigues, Equação (12.65), temos 


2L L! 

8, p) = (1) cr —— Pz (cos 6 
Yro(9, p) = (—1)ºcr CI L (cos 0) 
pe [E+ 
A 47 


=( 


Pz (cos 0). 


(12.163) 


(12.164) 


(12.165) 


(12.166) 


(12.167) 


(12.168) 


(12.169) 


(12.170) 


A última desigualdade resulta da Equação (12.161). Agora impomos que 4% zo(0, 0) seja real e positiva. Portanto, 


Lv (20)! 7A 


2L L! 


cr =(—1)Her| = 


(12.171) 
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Com (—1)2cr /lcz| = 1, Yzo(0, p) na Equação (12.170) pode ser identificada com o harmônico esférico Y? (0,9) 
da Seção (12.6). 
Quando substituímos o valor de (—1)2c; na Equação (12.168), 


auto 


0 
Prar(O, p) A n (L + mm 
iM M Ri 2L 
E ?sen e oga T [7) 
PE [LM amem 
47 (L+M)! 


drt+M 


1 M/2 É 
(=) area (2º — 1) }, x = cos ð, M >). 
(12.172) 


A expressão dentro da chave é identificada como a função associada de Legendre (Equação (12.151), e temos 
wrm(8, p) = YE (9,0) 


, [2L+1 (L-M)! ; 
= oy 4r (L+M) POEN A 


$ 


(12.173) 


em total concordância com a Seção 12.6. Então, pela Equação (12.73c), é para índice superior negativo é dado 
por 
Y5 (9,9) =(-D)M [YF (0, p)". (12.174) 
e Nossas autofunções de momento angular Yz (0, p) são identificadas com os harmônicos esféricos. O fator 
de fase (—1)™ é associado com os valores positivos de M e é considerado uma consegiiência dos operadores 
progressivos. 
e O desenvolvimento de harmônicos esféricos que fizemos aqui pode ser considerado uma porção da álgebra de 
Lie — relacionada à teoria de grupo, Seção 4.3. 


Exercícios 
12.7.1 Usando as formas conhecidas de L, e L. (Exercícios 2.5.14 e 12.6.7), mostre que 


fT E-E) dQ = f(E (Leva) dQ. 


12.7.2 Derive as relações 


(L+ M)! 
CLL- M)! 


T a A a-l. p). 


Sugestão: As Equações (4.83) e (4.84) podem ser úteis. 


(a) vrm, p) = (L-) Map r(0, p), 


(b) Yrm(9,9) = 


12.7.3 Derive as equações de operadores múltiplos 


d"sen “001 m(0) 
Lo)” 0 iM q =(-9” UM En)p NAM q LM 
(L,)"OLm(8)e (= 1 Je sen d 
d”sen 0Ozm (0) 


n iMp — UM-n)p n—M 
(L-)"Orm(0)e e sen 0 dlcos 0)” 


Sugestão: Tente indução matemática 


12.7.4 Usando (L_)”, mostre que 
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12.7.5 | Verifique por cálculo explícito que 
3 ; 
(a) LyYP(9,9) = -y qusen de“? = v2Y (0, 9), 


3 : 
O) L-YP(O, p) = + qusen det? = 2Y7"(9,9). 


Os sinais (fase de Condon-Shortley) são uma consegiiência dos operadores de levantamento e de 
abaixamento L, e L.. 


12.8 O Teorema da Adição para Harmônicos Esféricos 


Identidade Trigonométrica 

Na discussão a seguir, (01,414) e (02,45) denotam duas direções diferentes em nosso sistema de coordenadas 
esféricas (£1, Y1, z1), separadas por um ângulo y (Figura 12.16). Os ângulos polares 61, 0» são medidos a partir do 
eixo 21. Esses ângulos satisfazem a identidade trigonométrica 


cos y = cos 04 cos 05 + sen sen 05 cos(p, — 5), (12.175) 


que talvez seja provada com mais facilidade por métodos vetoriais (compare com Capítulo 1). 
Então, o teorema da adição afirma que 


P, (cosy) = Ma La DEV (dao), (12.176) 
ou, o que é equivalente, 
47 Z m m * 
Pn (cos 7) = 9n+ 1 E pai Ya (01,41) [Yn (92, 425)] 2 (12.177) 


Em termos das funções associadas de Legendre, o teorema da adição é 
P, (cos y) = Pa pe 0 a a 


+92 D C Pros 81) Pa (cos 02) cosm(py — p2). 


mE 


(12.178) 


A Equação (12.175) é um caso especial da Equação (12.178), n = 1. 


Derivação do Teorema da Adição 


Agora derivamos a Equação (12.177). Sejam (y, £) os ângulos que especificam a direção (01,1) em um sistema de 
coordenadas (£2, y2, 22) cujo eixo está alinhado com (02, Y>). (Na verdade, escolher O para o ângulo de azimute é 
na Figura 12.16 é irrelevante.) Em primeiro lugar, expandimos Y,” (01, 1) em harmônicos esféricos nas variáveis 


angulares (y, é): 
"(Br p1) = y ape YA (E): (12.179) 


o=—n 


Não escrevemos nenhum somatório sobre n na Equação (12.179) porque o momento angular n de Y” é conservado 
(veja a Seção 4.3); por ser um harmônico esférico, Y, n (Or, 1) é uma autofunção de L? com autovalor n(n + 1). 

Para nossa prova, precisamos apenas do coce enie apo» que obtemos multiplicando a Equação (12.179) por 
[Y2 (y, €)]* e integrando sobre a esfera: 


n0? 


amo = f YE On oD [KEO] re- (12.180) 


210 asterisco para conjugação complexa pode entrar em qualquer dos harmônicos esféricos. 
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x »2 


Figura 12.16: Duas direções separadas por um ângulo y. 


De modo semelhante, expandimos P, (cos y) em termos de harmônicos esféricos Y,” (01, p4): 


Am 1/2 n = 
Pa (cos y) = (==) YP (y,6) = 5 bnm Yn (01,91), (12.181) 


m=-n 


em que os bnm dependerão, é claro, de 85, 7», isto é, da orientação do eixo z2. Multiplicando por [Y;" (01, p1)]* e 
integrando com relação a 6, e y; sobre a esfera, temos 


bam = | Palcos JK (01,1) dorso (12.182) 


Em termos de harmônicos esféricos, a Equação (12.182) se torna 


4 1/2 , 


Note que os índices inferiores foram descartados do elemento de ângulo sólido dQ. Visto que a faixa 
de integração cobre todos os ângulos sólidos, a escolha do eixo polar é irrelevante. Então, comparando as 
Equações (12.180) e (12.183), vemos que 


Ar 1/2 
bim = al >— ; 12.184 


Agora, avaliamos Y,” (02, p>) usando a expansão da Equação (12.179) e observando que os valores de (y, €) 
correspondentes a (01, %1) = (02, p2) são (0,0). O resultado é 


(12.185) 


Im NR 
AT A 


(82,02) = aY e (0,0) = ara ( 
sendo que todos os termos com o não-zero desaparecem. Substituindo isso de volta na Equação (12.184), obtemos 


T 47 
“Qn+41 


[Y (02, pa). (12.186) 


nm 


Por fim, substituindo essa expressão para bnm no somatório, a Equação (12.181) resulta na Equação (12.177), o 
que prova nosso teorema da adição. 
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Quem está familiarizado com teoria de grupo achará uma prova muito mais elegante da Equação (12.177), 
usando a rotação de grupo.? Esse é o Exercício 4.4.5. 

Uma aplicação do teorema da adição é na construção de uma função de Green para a equação tridimensional de 
Laplace em coordenadas polares esféricas. Se a fonte estiver sobre o eixo polar no ponto (r = a,0 = 0,97 = 0), 
então, pela Equação (12.4a), 


1 a” 
RT a 5 eu (cos y) a r>a 


n 


= 5 P, (cos7)- i, r<a. (12.187) 


Rotacionando nosso sistema de coordenadas para colocar a fonte em (a, 02,3) e o ponto de observação em 
(r, 01,1), obtemos 


G(r, 01, 91,4, 02, P2) = 


4 * 
= o >: s 1 [97 (01, 91)] YR (02, po) ET? r>a, 


n 


4 . 
=Y e Ony) YOn p) r<a. (12.188) 


Na Seção 9.7 esse argumento é invertido para dar outra derivação do teorema da adição de polinômios de Legendre. 


Exercícios 

12.8.1 Quando provamos o teorema da adição, admitimos que Y,* (01, p4) podia ser expandido em uma 
série de Y” (02, 5), nos quais m variava de —n a +n mas n era mantido fixo. Que argumentos 
você pode desenvolver para justificar o somatório apenas sobre o índice superior, m, e não sobre o 
índice inferior, n? 
Sugestões: Uma possibilidade é examinar a homogeneidade dos Y”, isto é, Y,” podem ser 
expressos inteiramente em termos da forma cos”? ĝsen?ð, ou x” PTsyPzS/r”. Uma outra 
possibilidade é examinar o comportamento da equação de Legendre sob rotação do sistema de 
coordenadas. 


12.8.2 Um elétron atômico com momento angular L e número quântico magnético M tem uma função de 
onda 


y(r, 0, p) = f(rYE (o, p). 
Mostre que a soma das densidades dos elétrons em uma dada camada completa é esfericamente 
simétrica; isto é, DE vo (7,0, p)y(r,0,) é independente de 0 e o. 
12.8.3 O potencial de um elétron no ponto re no campo de Z prótons nos pontos r, é 


a a: > re 


Mostre que essa expressão pode ser escrita como 


T * 
Ee ao =) sil? “(Ops Pp)] Yi (Bes Pe), 


p=1L,M 


=j 


em que re > rp. Como Ẹ seria escrita para re < rp? 


12.8.4 Dois prótons são uniformemente distribuídos dentro do mesmo volume esférico. Se as coordenadas 
de um elemento de carga são (71,01,1) e as coordenadas do outro são (r2,02,/5) e rip é a 
distância entre eles, então o elemento de energia de repulsão será dado por 

dy 2 dTı dT2 ati drısen 0i dı dyi r2 drosen 02 dd» dpo 


T12 T12 


2 Compare M. E. Rose, Elementary Theory of Angular Momentum, Nova York: Wiley (1957). 


606 
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12.8.5 


12.8.6 


12.8.7 


12.8.8 


Aqui, 


carga 3e 


i = IRE’ densidade de carga, 
volume T 


EN jo O ; 
ria =T] + T2 — 21979 cosy. 


Calcule a energia eletrostática total (de repulsão) dos dois prótons. Esse cálculo é usado para 


justificar a diferença de massa em núcleos “espelho”, tais como O!º e N15, 
2 


Resposta: n, 
5R 


Isso é o dobro do requerido para criar uma esfera uniformemente carregada porque temos duas 
nuvens de carga separadas interagindo, mas nenhuma das cargas interagindo consigo mesma (não 
considerando permutação de pares). 


Cada um dos dois elétrons 1,S do hélio pode ser descrito por uma função de onda hidrogenóida 
Z3 1/2 é 
= ESE —Zr/ao 
w(i) e 


na ausência do outro elétron. Aqui, Z, o número atômico, é 2. O símbolo ao é o raio de Bohr, 
h2 /me?. Ache a energia potencial mútua dos dois elétrons, dada por 


2 
ve) (r2) Elen (ro) dra dê, 


5e2Z 
Resposta: E 
8ao 


Nota: dri = r? drısen 04 d0ı dy1 = dr, T12 = Ir — ro|. 


A probabilidade de encontrar um elétron de hidrogênio 15 em um elemento de volume 
r? drsen 6 do dy é 


1 
—s exp[-2r /ao]r” drsen 0 do dọ. 
Tag 
Ache o potencial eletrostático correspondente. Calcule o potencial por 


Vm) = 4 J Eeh, 


ATEQ T12 


sendo que rı não está sobre o eixo z. Expanda r12. Aplique o teorema da adição de polinômios de 
Legendre e mostre que a dependência angular de V (rı) se anula. 


1 2 1 2 
Resposta: V (r1) = Te [5 (3, m) + F r(2 =) k 
0 1 0 0 9 


Um elétron de um átomo hidrogênio em uma órbita 2P tem uma distribuição de carga 


q 


= sr2e"/%0sen?0, 
647a% 


p 


onde aq é o raio de Bohr, A? /me?. Ache o potencial eletrostático correspondente a essa distribuição 
de carga. 


A densidade de corrente elétrica produzida por um elétron 2P em um átomo de hidrogênio é 


a ah —r/a 
J= ma /%rsen 6. 
Usando It) 
Ho r2 3 
A = — | ———— d 
(rı) Am / Ira e ra | pau 


ache o potencial vetorial magnético produzido por esse elétron de um átomo de hidrogênio. 
Sugestão: Resolva em componentes cartesianas. Use o teorema da adição para eliminar y, o ângulo 
incluído entre rı e ro. 
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12.8.9 (a) Como série de Laplace e como exemplo da Equação (1.190) (agora com funções complexas), 
mostre que 


(01 — Q2) = 5 5 Ya” (02, p2) Yn (01,91). 
n=0m=—n 


(b) Mostre também que essa mesma função delta de Dirac pode ser escrita como 


C9n+1 
AT 


HQ — NR) = 


n=0 


Pa(cos y). 


Agora, se você puder justificar os somatórios sobre n termo a termo, terá uma derivação alternativa 
do teorema da adição de harmônico esférico. 


12.9 Integrais de Produtos de Três Harmônicos Esféricos 


Freqüentemente encontramos em Mecânica Quântica integrais da forma geral 


27 T 
ORAYA) = [O f DET YAYA sen ooo 


2L + 1)(2L3+1 
= TE TAS ) O(LzL3L11000)C(L2L3L1|M2M3M1), 
(12.189) 


nas quais todos os harmônicos esféricos dependem de 0, p. O primeiro fator no integrando pode vir da função de 
onda de um estado final e o terceiro fator de um estado inicial, enquanto o fator do meio pode representar um 
operador que está sendo avaliado ou cujo “elemento de matriz”está sendo determinado. 

Usando métodos teóricos de grupo, como na teoria quântica de momento angular, podemos dar uma expressão 
geral para as formas listadas. A análise envolve os coeficientes de adição vetorial ou de Clebsch-Gordan da 
Seção 4.4, que são tabulados. Surgem três restrições gerais. 

1. A integral se anula, a menos que a condição de triângulo dos L (momento angular) seja zero, |L — Ls| < La < 

Ly + La. 

2. A integral se anula, a menos que Mə + M3 = Mı. Aqui, temos o fundamento teórico do modelo vetorial da 
espectroscopia atômica. 

3. Por fim, a integral se anula, a menos que o produto EE ye seja par, isto é, a menos que Li + Lo + Ls 
seja um inteiro par. Essa é uma lei de conservação de paridade. 

A chave para a determinação da integral na Equação (12.189) é a expansão do produto de dois harmônicos 
esféricos que dependem dos mesmos ângulos (ao contrário do teorema da adição), os quais estão acoplados 
por coeficientes de Clebsch-Gordan ao momento angular L, M, que, por suas propriedades de transformação 
rotacional, deve ser proporcional a yM (8, p), isto é, 


5 C(L2L3L1|M2M3 My) Y}. (0, pype (8, p) ~ yp: (8, p). 
Mı,M2 


Para detalhes, referimo-nos a Edmonds.? 
Vamos esboçar algumas das etapas dessa abordagem geral e poderosa usando a Seção 4.4. 
O teorema de Wigner-Eckart aplicado ao elemento de matriz na Equação (12.189) resulta em 


(YEN ri? Yg) = (11) teta C (LaLsL1| M2 M3 M1) 
(Yz, IYr Yz) 


, l (12.190) 
(2L +1) 


em que as barras duplas denotam o elemento de matriz reduzido, que não depende mais dos M;. As regras de 
seleção (1) e (2) mencionadas antes resultam diretamente do coeficiente de Clebsch-Gordan na Equação (12.190). 


BE. U. Condon e G. H. Shortley, The Theory of Atomic Spectra, Cambridge, UK: Cambridge University Press (1951); M. E. Rose, 
Elementary Theory of Angular Momentum, Nova York: Wiley (1957); A. Edmonds, Angular Momentum in Quantum Mechanics, Princeton, 
NJ: Princeton University Press (1957); E. P. Wigner, Group Theory and Its Applications to Quantum Mechanics (traduzido por J. J. Griffin), 
Nova York: Academic Press (1959). 
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Em seguida usamos a Equação (12.190), para Mı = M2 = M3 = 0, em conjunção com a Equação (12.153), para 
m = 0, o que resulta em 


(—1)Za—Lata 


v2Lı +1 
E (E + 1)(2L2 + D(2L3 + 1) 
47 


(YE, |Y, Yb) = C(L2L3 L11000) - (Yz, ||Yz||Yzs) 


1 1 
a / À Pr, (x)Pr,(x)Pr, (£) dx, (12.191) 
em que x = cos 0. Por métodos elementares, pode-se mostrar que 
: 2 
J Pislo)Prs(0)Pro(a) do = 
i 


—— C(LoLaL 2 12.192 
Ti 7 C( DE DRE DA |000) ( ) 
Substituindo a Equação (12.192) em (12.191), obtemos 


2L + 1)(2L3 + 1) 


(Yr: l|Yr:l|Yz:) = (=1)72=20+t1 (Ea LaL 000) Í 


(12.193) 

47 
A regra de seleção de paridade (3) já mencionada resulta da Equação (12.193) em conjunção com a relação de fase 
C(LaL3h1| — M2, — M3, -M1) = (—1)t2ta-L C(L L3 Lı| MM3 M1). (12.194) 


Note que os coeficientes de adição vetorial são desenvolvidos em termos da convenção de fase de Condon- 
Shortley,?’ na qual o (—1)” da Equação (12.153) é associado com o m positivo. . 

É possível avaliar muitas das integrais comumente encontradas dessa forma com as técnicas já desenvolvidas. 
A integração sobre o azimute pode ser efetuada por inspeção: 


2T 
1 eiM? eiM2p eiM? do = Irma +M3—M1,0- (12.195) 
0 
Em termos físicos, isso corresponde à conservação da componente z do momento angular. 


Aplicação de Relações de Recorrência 

Um breve exame da Tabela 12.3 mostrará que a dependência de de os isto é, Pro (0), pode ser expressa em 
termos de cos 0 e sen 0. Contudo, um fator de cos 0 ou sen 0 pode ser Combinado com o fator yx 13 usando as 
relações de recorrência dos polinômios associados de Legendre. Por exemplo, pelas Equações (2: 92) e (12.93) 
obtemos 


L-M+ Tea 


som = + |É 
PM +| (CL+I(2L+3) Ea 


(L-M(L+M)) 
pro | Yi (12.196) 
[t+ UM) pra 

(2L + 1)(2L + 3) L+1 
TE- M-D aa 
| (2L -—1)(2L +1) | E (12.197) 
= a 

(2L + 1)(2L + 3) L+1 
(L+ M)(L+M-1)] P u 
| (2L — D(2L+1) | Fil. (12.198) 


e'?sen OYM = 


e“Psen gy! = +| 


Usando essas equações, obtemos 


. L-M+1)\(L+M+1)]!? 
Ja cos 0Y / dQ = i CL+ ( | ÔMı,MÔLı,L+1 


) 
) 
(L+ M) 
( 


1/2 
ô ô ssis 12.199 
GLI R] M,,MÔL,,L-1 ( ) 
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A ocorrência do delta de Kronecker (Lı, L + 1) é um aspecto da conservação do momento angular. Em termos 
físicos, essa integral surge em uma consideração de radiação eletromagnética atômica ordinária (dipolo elétrico). 
Ela leva à familiar regra de seleção, que diz que transações para um nível atômico com número quântico de 
momento angular orbital Lı só podem se originar de níveis atômicos com números quânticos Lı — 1 ou Lı + 1. A 
aplicação de expressões como 


momento de quadrupolo ~ / YP * (0, p) Palcos 0)YP (0, p) dO 
é mais complicada porém perfeitamente direta. 


Exercícios 
12.9.1 Verifique 


1 
(a) / VE CO, ENS O, PYE (0,6) dO = =, 


My0y Mx (L+M=+1)\(L-M+1) 
© Jy HINN E (2L+1I(2L+3) ° 

M M+1+ (L+M+1(L+M +2) 
(o fy viv m= E Gr nie 


-M= 
M M+1x* 
o fy no a: HE ao WSI 


Essas integrais foram usadas em uma investigação da correlação angular de elétrons de conversão 
interna. 


12.9.2 Mostre que 


1 2(L+1) a 
(a) | POPNE de PEEGEL) 
Bino REg 
D N=L+2 


(2L +1)(2L +3)(2L +5)’ 


Ea 2(2L? +2L-1) o 
(b) [s Pr(a)Pn(a) da GL- DOLF ICLEI N= L, 
2L(L— 1) ranra 


(2L -—3)\(2L — 1)(2L +1) 
12.9.3 Visto que xP, (x) é um polinômio (grau n + 1), ele pode ser representado pela série de Legendre 


ES asP,(2) 
s=0 


(a) Mostre que as = O,paras<n—-les>n+l. 
(b) Calcule an-1,an € any+1 e mostre que você reproduziu a relação de recorrência, 
Equação (12.17). 
Nota: Esse argumento pode ser colocado em uma forma geral para demonstrar a existência de 
uma relação de recorrência de três termos para qualquer um de nossos conjuntos completos de 
polinômios ortogonais: 
TP = ün+1Pn+1 T anPn T An-1Pn-1º 


12.9.4 Mostre que a Equação (12.199) é um caso especial da Equação (12.190) e derive o elemento de 
matriz reduzida (Yz, [Ni||Yz). 
3(2L + 1) 


Resposta: (Yz, || Ya || Yz) = (1) HI-LC(1LL,|000) 7 
T 
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12.10 Funções de Legendre da Segunda Espécie 


Em todas as análises que fizemos até aqui, tratamos com uma solução da equação de Legendre, a solução P, (cos 6), 
que é regular (finita) nos dois pontos singulares da equação diferencial, cos 0 = +1. Pela teoria geral das equações 
diferenciais, sabemos que existe uma segunda solução. Desenvolvemos essa segunda solução, Qn, com n inteiro 
não-negativo (porque, em aplicações, Qn ocorrerá em conjunção com P,), por uma solução de série da equação 
de Legendre. Mais adiante obteremos uma forma fechada. 


Soluções de Série de Equação de Legendre 
Para resolver 


d a dy l = 
SE [a z | En(n+Dy=0 (12.200) 


procederemos como no Capítulo 9, fazendo?” 


y= artt, (12.201) 
A=0 
com 
y = 5k + a tT, (12.202) 
A=0 
W=53 (k+A(k+A-— 1)ag t, (12.203) 
A=0 


Substituindo na equação diferencial, original, temos 


> k+N(k+ A — Dapattio? 
A=0 


+ s [n(n +1) — 2(k +A) — (k +A)(k +à — 1)]axs" t = 0. (12.204) 


> 
Il 
fem) 


A equação indicial é 
k(k— 1) =0, (12.205) 


com soluções k = 0,1. Tentamos primeiro k = 0 com ag = 1,14 = 0. Então, nossa série é descrita pela relação 
de recorrência 
(A +2)(A + Dara + [n(n + 1) — 2å — MAD] = 0, (12.206) 


que se torna 
ao WTAE =A 
ADe A+FDA+2) 


Rotulando essa série pela Equação (12.201) como y(x) = pn (x), temos 


ax. (12.207) 


n(n+1) > (n—2)n(n+1)(n+3) 4 


Pnla) = 1 a T+ qt +. (12.208) 


A segunda solução da equação indicial, k = 1, com ag = 0, aı = 1, leva à relação de recorrência 


o (n+A+Pn— A 1) 
Hapa (A+A +3) 


ax. (12.209) 


Rotulando essa série pela Equação (12.201) como y(x) = qn(x), obtemos 


qula) = x ua Mu a pira hs uu ao Lao N (12.210) 


24Note que x pode ser substituído pela variável complexa z. 
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Então, nossa solução geral da Equação (12.200) é 


contanto que haja convergência. Pelo teste de Gauss, Seção 5.2 (veja o Exemplo 5.2.4), não temos convergência 
em x = +1. Para sair dessa dificuldade, igualamos a constante de separação n a um inteiro (Exercício 9.5.5) e 


convertemos a série infinita em um polinômio. 
Para n inteiro positivo par (ou zero), a série p, termina e, com uma escolha adequada de um fator de 
normalização (selecionado para obter concordância com a definição de P, (x), na Seção 12.1, 


n! (2s)! 


Pala) ( 1)”/2 OA = CD's? O) 
= 0p E i nlo), para n = 2s. (12.212) 


Se n for inteiro positivo ímpar, a série qn termina após um número finito de termos, e escrevemos 


n! 


2-1 {fn — 1)/2]) 


= y enla) = CD Ei P oila), pran= 25+1 


O (—1º-U/2 3 An) 


(12.213) 


Note que essas expressões são válidas para todos os valores reais de x, —oo < x < oo e para valores complexos 
no plano complexo finito. As constantes que multiplicam p, e qn são escolhidas para fazer com que os P, estejam 
de acordo com os polinômios de Legendre dados pela função geradora. 

As Equações (12.208) e (12.210) ainda podem ser usadas com n = v, não sendo inteiro, mas agora a série não 
é mais truncada e a faixa de convergência se torna —1 < x < 1. As extremidades, x = +1, não são incluídas. 

Às vezes é conveniente inverter a ordem dos termos na série, o que pode ser feito colocando 


s= 5 —À na primeira forma de P, (x), n par, 
n—1 E 
bme TO A na segunda forma de Pa (x), n ímpar, 


de modo que as Equações (12.212) e (12.213) se tornam 


[n/2] 


P, (£) = E Do rita T (12.214) 


em que o limite superior s = n/2 (para n par) ou (n — 1)/2 (para n ímpar). Isso reproduz a Equação (12.8) da 
Seção 12.1, que é obtida diretamente da função geradora. Essa concordância com a Equação (12.8) é a razão para 
a escolha particular de normalização nas Equações (12.212) e (12.213). 


Funções Q, (x) da Segunda Espécie 
É bom observar que usamos somente p, para n par e qn para n ímpar (porque eles terminam para essa escolha de 
n). Agora podemos definir uma segunda solução da equação de Legendre (Figura 12.17) por 


oac e q, (o 
os (28)! a 
=(—1) GE Tn es (2), para n par, n = 2s, (12.215) 
— 1)/2]!1}22”-1 
Qhn(2) = (-1)0+9/2 tn = } 5 
= (=1)8H! (25) P2s+41(£), para n ímpar, n = 2s + 1. (12.216) 


(2s+1)!! 
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0,5 


i 
L > x 


QŒ) 


Figura 12.17: Segunda função de Legendre, Qn(x),0< x <1. 


Essa escolha de fatores de normalização força Qn a satisfazer as mesmas relações de recorrência que Pp. Isso 
pode ser verificado substituindo as Equações (12.215) e (12.216) nas Equações (12.17) e (12.26). Inspeção das 
relações de recorrência (série) (Equações (12.207) e (12.209)), isto é, pelo teste da razão de Cauchy, mostra que 
Qn(x) convergirá para —1 < x < 1. Se |x| > 1, essas formas de série de nossa segunda solução divergem. 
Pode-se desenvolver uma solução em uma série de potências negativas de x para a região |x| > 1 (Figura 12.18), 
mas passamos para uma solução de forma fechada que pode ser usada em todo o plano complexo (exceto para os 
pontos singulares x = +1 e tomando cuidado nas linhas de corte). 


Soluções de Forma Fechada 
Muitas vezes é desejável uma forma fechada da segunda solução, Qn (z). Ela pode ser obtida pelo método discutido 
na Seção 9.6. Escrevemos 


Qn(2) = Pl Am + Ba J SRE (12.217) 


na qual a constante 4, substitui a avaliação da integral no limite inferior arbitrário. Ambas as constantes, 4, e 
B,. podem ser determinadas para casos especiais. 
Para n = 0, a Equação (12.217) resulta em 


z dx 1. 1+z 

Mole) of ps o / HIRO) ER a 
A+B é a ao 12218 
= Ao + (pE) (12.218) 


sendo que a última expressão resulta de uma expansão de Maclaurin do logaritmo. Comparando essa expressão 
com a solução de série (Equação (12.210)), obtemos 


23 z5 g2s+1 
E = E E E E onto 12.219 
Qo(z) = qo(2) z+ tg toe tit ( ) 
sendo Ag = 0, Bo = 1. Resultados semelhantes são conseguidos para n = 1. Obtemos 
d dz 

=z|A +B — 

Qu(z) e| IE f a o 

1.1 1 
TER fe pn a (12.220) 

2 l-z z 
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10º 


107! 


1072 


10% 


107 


2 4 6 8 10 


Figura 12.18: Segunda função de Legendre, Qn (x), £z > 1. 


Expandindo em uma série de potências e comparando com Q1(2) = —p1(z), temos Aı = 0, Bı = 1. Portanto, 
podemos escrever 
1.1 1 1 
oem À dus A (12.221) 
2 l-z 2 l-z 


Talvez o melhor modo de determinar a Q„(z) de ordem mais alta seja usar a relação de recorrência 
(Equação (12.17)), que pode ser verificada para ambos, x? < 1 e x? > 1, por substituição em formas de série. 
Essa técnica de relação de recorrência resulta em 


1 1 
gac rOn =p (12.222) 
2 l-z 2 
Aplicação repetida da fórmula de recorrência leva a 
1 l+z 2n-1 2n— 5 
n(Z) = =Pa(2)1 — Pi- — = Pn- =. 12.223 
Qala) = FP n = a Pale) — qa) e (12.223) 


Pela forma In[(1 + z)/(1 — z)], veremos que, para z real, essas expressões são válidas na faixa —1 < x < 1. Se 
quisermos ter formas fechadas válidas fora dessa faixa, basta substituir 


l+a 2+1 


l l . 
n por a 


l-r 


Ao usarmos a última forma, válida para z grande, consideramos o intervalo de linha —1 < x < 1 uma linha de 
corte. Valores de Qn (x) sobre a linha de corte costumam ser designados pela relação 


a média aritmética das aproximações pelo lado imaginário positivo e pelo lado imaginário negativo. Note que para 
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s>wr>l,zg-1>(1-— bjo. O resultado é que, para todo z, exceto sobre o eixo real, —1 < x < 1, temos 


1 z41 
1 1 

A ES (12.226) 
2 z— 1 


e assim por diante. 
Para conveniente referência, são dados alguns valores especiais de Qn (2). 

1. Qu(1) = oo, pelo termo logarítmico (Equação (12.223). 

2. Qn(oo) = 0. Esse valor é mais bem obtido por uma representação de Q, (1) como uma série de potências 
negativas de x, Exercício 12.10.4. 

3. Qu(—2) = (—1)""1Q,(2). Resulta da forma de série. Também pode ser derivado usando Qo(z), Qi(z) e a 
relação de recorrência (Equação (12.17)). 

4. Qn(0) = 0, para n par, por (3). 


2 
da (n+1)/2 (0 -= 1)/2!¥ aos 
25)! 
= Dt para n ímpar, n = 2s + 1. 
s 1! 
Esse último resultado vem da forma de série (Equação (12.216)) com pn (0) = 1. 
Exercícios 


12.10.1 Derive a relação de paridade para Qn (x). 
12.10.2 Pelas a P a e (12.213), mostre que 


(2n + 2s — 1)! x 
Pala os s, 
(a) P - in + s— 1)! (n— s)!” 


E (=1)” n s (2n +25 +1)! 2s+1 
O) Ponyi(a) = a di Dale 


Verifique a normalização mostrando que um termo de cada série está de acordo com o termo 
correspondente da Equação (12.8). 
12.10.3 Mostre que 


(8) Qanla) = (1) > tt o E ron oii 


s=0 
mn © (n++s)!(2s— 2n)! s41 
E alo qu + Ri 
Es n+Ilo2n is o (n+ s)! (n= s)! A 
O) Qanla) =D D asian = 2541) 


s=0 


(2s — 2n — 2 
+ 220+ S E $ n )! r25 
Psi o A 


12.10.4 (a) Começando com a forma admitida 


oo 
= > bosta, 
A=0 


mostre que 


par (n+ In +2)M2n +1)! ss 
Orla) = box 3 s!(n!)2(2n +2s + 1)! ` 


(b) A escolha é padrão de bo 
2” (n!)? 


iu: (en + D! 
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Mostre que essa escolha de bo leva essa forma de série de potências negativas de Qu(x) à 
concordância com as soluções de forma fechada. 


12.10.5  Comprove que as funções de Legendre da segunda espécie, Qn (x), satisfazem as mesmas relações 
de recorrência que P, (x), para |x| < 1 e também para |x| > 1: 


(2n + DxQnlx) = (n + 1)Qn+1 (£) + nQn-1 (2), 
(2n +1)Qn (2) = Qn (2) — Qh-1 (2). 


12.10.6 (a) Usando as relações de recorrência, prove (independente da relação wronskiana) que 


nÃPa(o)Qu-(a) — Pa-1(2)Qn(2)] = Pi (£)Qo(2) — Polx)Qu(a). 


(b) Mostre, por substituição direta, que o lado direito dessa equação é igual a 1. 


12.10.7 (a) Escreva uma sub-rotina para gerar Qn(x) e Qo até Qn—ı com base na relação de recorrência 
para essas funções de Legendre da segunda espécie. Considere x entre (—1,1), excluindo as 
extremidades. 

Sugestão: Considere que Qo(x) e Q1(x:) são conhecidos. 
(b) Teste a precisão de sua sub-rotina calculando Q1o(x) e comparando com os valores tabulados 
em AMS-55 (a referência completa é fornecida em Leituras Adicionais do Capítulo 8). 


12.11 Harmônicos Esféricos Vetoriais 


Neste capítulo, grande parte de nossa atenção foi dirigida à resolução das equações de campos escalares, como o 
potencial eletrostático. Fizemos isso primordialmente porque os campos escalares são mais fáceis de manipular do 
que os campos vetoriais. Contudo, agora que os problemas de campo escalar já estão sob firme controle, vamos 
dar maior atenção a problemas de campos vetoriais. 

As equações de Maxwell para o vácuo, onde a corrente externa e as densidades de carga se anulam, levam à 
equação de onda (ou vetorial de Helmholtz) para o potencial vetorial A. Em uma expansão parcial de onda de 
A em coordenadas polares esféricas, queremos usar autofunções angulares que são vetores. Com essa finalidade, 
escrevemos os vetores unitários de coordenadas x, y, Z em notação esférica (veja a Seção 4.4), 

Eq OO vd mu (12:227) 
v2 v2 
de modo que êm forma um tensor esférico de grau 1. Se acoplarmos os harmônicos esféricos com os êm ao 
momento angular total J usando os coeficientes de Clebsch-Gordan relevantes, chegamos aos harmônicos esféricos 
vetoriais: 


Yyzm;(9,9) = >) C(L1J|MmM3 Y} (0, p)êm. (12.228) 
m,M 


É óbvio que eles obedecem às relações de ortogonalidade 


fiim (0, p): Y rrm, (0, p) dQ = yzy ôrr ÔM; M: (12.229) 


Dado J, as regras de seleção do acoplamento de momento angular nos dizem que L só pode assumir os valores 
J+1,JeJ-—1. Se consultarmos os coeficientes de Clebsch-Gordan e invertermos a Equação (12.228), obteremos 


L+1 


Yr 12.230 
2LF] LL-M; ( ) 


1/2 L 1/2 
Y ao 
| LL+1M + sia] 


YZ" (0, p) = -| 


que exibe o caráter vetorial de Y e o conteúdo do momento angular orbital, L + 1 e L — 1, de yM ; 
Sob as operações de paridade (inversão de coordenadas), os harmônicos esféricos vetoriais se transformam em 


Yrm, p) = (1) Y rrym (0,9), 
Yrram(8 4) = (1) Y 1r-1m (0,9), (12.231) 
Yrim(8',0) = (-1) Yrm (0,9), 
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em que 
=7-0 qd=T+o. (12.232) 


Os harmônicos esféricos vetoriais são úteis em um desenvolvimento posterior dos operadores de gradiente 
(Equação (2.46)), de divergência (Equação (2.47)) e do rotacional (Equação (2.49)) em coordenadas polares 
esféricas: 


L+1]Pfd L 
V[F(r)Y¥ (0, p] = E | [5 [PY usem 
Ergo L+1 
FYLL 12.2 
+ | [5 + m | LL-1M; (12.233) 
i L+1\'PfdF L+2 
V- [F()Yrr+1m(0,)] = (5 =) | T F YE (0, p); (12.234) 
LAVTAR Ai Toa 
V- [F(r)Yzr-1m(0,p)] = PES] E F|YF (0,9), (12.235) 
V-[F(r)Yzcm(0,9)] =0, (12.236) 
e e pr. TD 
V x [F(Y rrm] = ila z E F)virm (12.237) 
ao / L \fdaF L 
Vx [F(r)Y¥ rrm] =i( z) E CF [Yoseam 
do er Re L+1 
H (arm) É + F)rir-am (12.238) 
V x [F(r)Y = L+1 Hdr E pg (12.239) 
r et =1 YA a! 
LL-1M 2L41 dr LLM 


Se substituirmos a Equação (12.230) na componente radial t0/0r do operador de gradiente, por exemplo, 

obteremos ambos os termos dF'/dr na Equação (12.233). Para uma derivação completa das Equações (12.233) 

a (12.239), referimos-nos à literatura.” Essas relações desempenham um importante papel na expansão de onda 

parcial da eletrodinâmica clássica e também da quântica. 

As definições dos harmônicos esféricos vetoriais dadas aqui são ditadas pela conveniência, primordialmente 
em cálculos de Mecânica Quântica, nos quais o momento angular é um parâmetro significativo. Mais exemplos 
da utilidade e potência dos harmônicos esféricos vetoriais serão encontrados em Blatt e Weisskopf,2º em Morse e 
Feshbach (veja Referências Gerais no final do livro) e em Jackson, Classical Electrodynamics, 3º ed., Nova York: 
J. Wiley & Sons (1998), que usa harmônicos esféricos vetoriais em uma descrição de radiação de multipolo e 
problemas eletromagnéticos relacionados. 

e Harmônicos esféricos vetoriais são desenvolvidos acoplando L unidades de momento angular orbital e 1 unidade 
de momento angular de spin. Uma extensão, acoplando L unidades de momento angular orbital e 2 unidades de 
momento angular de spin para formar harmônicos esféricos tensoriais é apresentada por Mathews.? 

e A principal aplicação de harmônicos esféricos tensoriais é na investigação de radiação gravitacional. 


Exercícios 


12.11.1 Construa os harmônicos esféricos vetoriais l = 0,m = 0e l = 1,m = 0. 
—1/2 


Resposta: Yo10 = —î (47) 
Yooo = 0 ; 
Yi20 = —f(2m) 1/2 cos 6 — 9(87)-1/2sen 0 
Yao = Qi(3/8r) "sen 0 
Yioo = ĉ(4r) 71? cos 0 — 9(47)1/2sen 0. 


25E, H. Hill, Theory of vector spherical harmonics, Am. J. Phys. 22: 211 (1954); também J. M. Blatt e V. Weisskopf, Theoretical Nuclear 
Physics, Nova York: Wiley (1952). Note que Hill designa fases de acordo com a convenção de fase de Condon-Shortley (Seção 4.4). Na notação 
de Hill, Xm = YLLm, Vtm = YLi4siM, WLM = YLL-IM. 

267, Mathews, Gravitational multipole radiation, em In Memoriam (H. P. Robertson, ed.), Filadélfia: Society for Industrial and Applied 
Mathematics (1963). 
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12.11.2 


12.11.3 
12.11.4 


12.11.5 


12.11.6 


Verifique que a paridade de Y zz41m é(-1)2+H ade Yiim é(-1)/ eade Y iram é (—1)L+, 
O que aconteceu com a dependência de M da paridade? 
Sugestão: ĉ e Y têm paridade ímpar; O tem paridade par (compare com o Exercício 2.5.8). 


Verifique a ortonormalidade dos harmônicos esféricos vetoriais Yyzm,- 


O livro Classical Electrodynamics, 3% ed. de Jackson (veja referência fornecida em Leituras 
Adicionais do Capítulo 11) e define Y zz pela equação 


1 
Yzrm(0, p) = ma A 


na qual o operador de momento angular L é dado por 


L = —i(r x V). 
Mostre que essa definição está de acordo com a Equação (12.228). 
Mostre que 
L 
* 2L+1 
se Yizm(o,9):Yzim(9,p) = a 


M=-L 


Sugestão: Uma maneira é usar o Exercício 12.11.4 com L expandido em coordenadas cartesianas 
usando os operadores de elevação e redução da Seção 4.3. 


Mostre que 
fYiim (€x Yzrrm)dQ =0. 


O integrando representa um termo de interferência em radiação eletromagnética que contribui para 
distribuições angulares mas não para intensidade total. 


Leituras Adicionais 

Hobson, E. W., The Theory of Spherical and Ellipsoidal Harmonics. Nova York: Chelsea (1955). Essa é uma 
referência muito completa e o texto clássico sobre polinômios de Legendre e todas as funções relacionadas. 

Smythe, W. R., Static and Dynamic Electricity, 3% ed. Nova York: McGraw-Hill (1989). 

Veja também as referências listadas nas Seções 4.4 e 12.9 e no final do Capítulo 13. 
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Mais Funções Especiais 


Neste capítulo estudaremos quatro conjunto de polinômios ortogonais, Hermite, Laguerre e Chebyshev! Embora 
esses quatro conjuntos sejam de menor importância para a Física Matemática do que as funções de primeiro 
e segundo tipos. Bessel e Legendre dos Capítulos 11 e 12, eles são usados e, portanto, merecem atenção. Por 
exemplo, polinômios de Hermite ocorrem em soluções do oscilador harmônico simples da Mecânica Quântica e 
polinômios de Laguerre em funções de onda do átomo de hidrogênio. Como as técnicas matemáticas gerais são 
as mesmas dos dois capítulos anteriores, o desenvolvimento dessas funções é apenas esboçado. Deixamos para o 
leitor as provas detalhadas, nas linhas dos Capítulos 11 e 12. Expressamos esses polinômios e outras funções em 
termos de funções hipergeométricas e hipergeométricas confluentes. Para concluir o capítulo, apresentamos uma 
introdução às funções de Mathieu, que surgem como EDOs e EDPs com condições de fronteira elípticas. 


13.1 Funções de Hermite 
Funções Geradoras — Polinômios de Hermite 


Figura 13.1: Polinômios de Hermite. 


Os polinômios de Hermite (Figura 13.1), H, (x), podem ser definidos pela função geradora? 


oo E” 
g(x,t) = et =S Hom). (13.1) 
n: 
n=0 


Relações de Recorrência 


Note a ausência de um índice superior, que distingue polinômios de Hermite das funções de Hankel não 
relacionadas. Pela função geradora constatamos que os polinômios de Hermite satisfazem as relações de 


l Esta é a ortografia escolhida em AMS-55 (a referência completa é fornecida na nota de rodapé 4 no Capítulo 5). Contudo, encontram-se 
várias outras ortografias, como Tschebyscheff. 
?Uma derivação dessa função geradora de Hermite é esboçada no Exercício 13.1.1. 
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recorrência 
Hal) = 2x1 Hn (x£) — 2n Hn-1 (x) (13.2) 
e 
H! (x) = 2nHn—1 (£). (13.3) 
A Equação (13.2) é obtida diferenciando a função geradora em relação a t: 
ag = (—2t + Ig) “te = =D tuto 
ot 


= 25. Mnl + Male 


que pode ser reescrita como 


> AO — 2xH, (£) + 2n Hn- (x)| =0. 
n=0 


Como cada coeficiente dessa série de potências se anula, a Equação (13.2) é estabelecida. De modo semelhante, a 
diferenciação em relação a x leva a 


ag = Me Pta — 2 E to =2 » Ha ( 


n=0 


ia 


que resulta na Equação (13.3) após a troca do índice de somatório n na última soma n + 1 > n. 
A expansão de Maclaurin da função geradora 


eta = y (txt = 1 + (2ta E t°) +... (13.4) 


n! 
n=0 


resulta em Ho(x) = 1 e Hi(x) = 2x e, então, a equação de recursão, Equação (13.2), permite a construção de 
qualquer H, (x) desejada (n inteiro). Para referência conveniente, alguns dos primeiros polinômios de Hermite são 
listados na Tabela 13.1.). 

Tabela 13.1 Polinômios de Hermite 


Hola) = 

Hi(a) = 24 

Ho(x) = 41º — 2 

Hs(x) = 8x? — 12x 

Hu(x) = 167º — 4872 + 12 

Hs(x) = 32x5 — 16043 + 120x 

Ho(x) = 642º — 4807! + 72022 — 120 


Valores especiais dos polinômios de Hermite resultam da função geradora para x = O: 


oo oO t 
= X Hu(0) 
n=0 n=0 
isto é, 
2n)! 
Hon (0) = E ei Honai(0) = 0, n=0,1,.... (13.5) 
n! 


Também obtemos da função geradora a importante relação de paridade 
Ha(a) = (—1)" Ha(—a) (13.6) 


observando que a Equação (13.1) resulta em 


—a,—t) -5 Hal =i = g(x,t) = >, Ha. 
n=0 
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Representações Alternativas 


A representação de Rodrigues de H, (x) é 


x2 d” 2 


Ha(a) = (—1)"e Ee. (13.7) 
da” 


A seguir, vamos demonstrar isso usando indução matemática. 


Exemplo 13.1.1 REPRESENTAÇÃO DE RODRIGUES 


Es P fi AN? 
Reescrevemos a função geradora como g(x,t) = e” e tt z)” e observamos que 


Dafra O spa 
ot ox 
Isso resulta em 
og 
ot o 
que é o caso inicial n = 1. Admitindo o caso n da Equação (13.7) como válido, agora usamos a identidade de 
operador Ler = 2re? + e?” + em 


= (2x — 289] = 2r = Hi(a)=-e” —e*, 
t=0 


m+1 n 
“pr? d -2 n+1 d z? z? «a —g? 
(—1)"Te AO =(—1) E 2xe E 
d 
= -g Hn(x) +2rHn(£) = Hana) 


para estabelecer o caso n + 1 com a última igualdade resultando das Equações (13.2) e (13.3). 
Mais diretamente, diferenciar a função geradora n vezes em relação a t e em seguida igualar t a zero resulta em 


H, (£) = ER o dr Pr- 


Uma segunda representação pode ser obtida usando cálculo de resíduos (Seção 7.1). Se multiplicarmos a 


= (ape Ee = (—1)”e 


= Es 
t= t= dx” 
0 o E 


Equação (13.1) por "1 e integrarmos ao redor da origem no plano complexo t, somente o termo com Hm (x) 
sobreviverá: i 
Hmla) = f olet +E dt, (13.8) 
2ri 


Além disso, pela expansão de Maclaurin, Equação (13.4), podemos derivar nosso polinômio de Hermite H, (x) 
na forma de uma série: usando a expansão binomial de (2x — t)” e o índice N = s + v, 


e +r — a (eu -=)= 3 a ] ( T ) (2x) (=t) 


em que [N/2] é o maior inteiro menor ou igual a N/2. Escrevendo o coeficiente binomial em termos de fatoriais e 
usando a Equação (13.1), obtemos 


[N/2] 


N! 
H E 2 N—2s =j goo ne 
TEE 
Mais explicitamente, substituindo N — n, temos 
2n! 4n! 
H, (£) = (2x) — ———— (2x)? 2x)”741-3 
a a a 


=D (Dt am (13.9) 
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Esta série termina para n inteiro e resulta em nosso polinômio de Hermite. 


Ortogonalidade 
Se substituirmos a equação de recursão, Equação (13.3), na Equação (13.2) podemos eliminar o índice n — 1, 
obtendo 

Hamn(a) =22H,(x) — H! (£), 


n 


que já foi usada no Exemplo 13.1.1. Se diferenciarmos essa relação de recursão e substituirmos o índice n + 1, 
encontramos 
H! (8) = 2(n + 1)Ho(2) = 2H (2) + 22H! (2) — H! (2), 


n 


que pode ser rearranjada para a EDO de segunda ordem para polinômios de Hermite. Assim, as relações de 
recorrência (Equações (13.2) e (13.3)) levam à EDO de segunda ordem 


H! (x) — 22H! (x) + 2n H, (x) = 0, (13.10) 


que, claramente, não é auto-adjunta. 
Para colocar a EDO em forma auto-adjunta, conforme a Seção 10.1, multiplicamos por exp(—z?), 
Exercício 10.1.2. Isso leva à integral de ortogonalidade 


/ Hm(v)Hn(o)e “dr=0, mn, (13.11) 


com a função de peso exp(—x2), uma consegiiência de colocar a EDO em forma auto-adjunta. O intervalo 
(—00,00) é escolhido para obter as condições de contorno do operador hermitiano, Seção 10.1. Às vezes é 
conveniente absorver a função de peso nos polinômios de Hermite. Podemos definir 


pn(x) = e Hp (2), (13.12) 


com , (1) não mais um polinômio. 
Substituição na Equação (13.10) resulta na equação diferencial para q, (x), 


pli(la)+ (2n +1- 2)pala) =0. (13.13) 


Essa é a equação diferencial para um oscilador harmônico simples da Mecânica Quântica, que talvez seja a mais 
importante aplicação física dos polinômios de Hermite. A Equação (13.13) é auto-adjunta e as soluções q, (x) são 
ortogonais para o intervalo (—c0 < x < o0) com uma função de peso unitária. 

O problema da normalização dessas funções permanece. Prosseguindo como na Seção 12.3, multiplicamos a 
Equação (13.1) por ela mesma e então por e 


=E 


2 
. Isso resulta em 
[0,0] 
2 2 2 2 
e? es +2sa oTt +2ta =, | e” Hm(£)Hn(£) 


m,n=0 


EA id 


mn! 


Quando integramos essa relação sobre x de —oo to +00, os termos cruzados da soma dupla são descartados por 
causa da propriedade da ortogonalidade:? 


e Ga / e” [Hn (x)| g da = J e778 + 2a t+ 2ta da 


n=0 —0C0 =00 
= / e (u—s—)2 28t de 
me n!/225t e n!/2 5 2" (st)? (13 14) 
= = nto f 
n=0 


usando as Equações (8.6) e (8.8). Igualando coeficientes de potências iguais de st, obtemos 


/ e [Hp(£)]? de = rn! (13.15) 


— 00 


3Os termos cruzados (m  n) podem ser conservados, se desejarmos. Então, quando os coeficientes de s“t? forem igualados, a 
ortogonalidade será aparente. 
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Oscilador Harmônico Simples da Mecânica Quântica 

O seguinte desenvolvimento do polinômios de Hermite por meio de funções de onda de oscilador harmônico 
simples à, (x) é análogo à utilização dos operadores de levantamento e abaixamento para operadores de momento 
angular apresentada na Seção 4.3. Isso significa que derivamos os autovalores n + 1/2 sem pressupor o 
desenvolvimento que levou à Equação (13.13). O aspecto fundamental da equação de autovalor, Equação (13.13), 
(É — 22)p (x) = —(2n + 1)p, (x), é que a hamiltoniana 


dx? 
d? d d d 
E dz? A (x z) (x +a) F fe. A (ado) 


quase se fatora. Fazendo uso ingênuo de a? — b? = (a — b)(a + b), o comutador básico da Mecânica Quântica, 
[ps x) = h/i (com momentum py = (h/i)d/dx), entra como uma correção na Equação (13.16). (Como py é 
hermitiano, d/dæ é anti-hermitiana, (d/dx)! = —d/dx.) Esse comutador pode ser avaliado como segue. Imagine 
que o operador diferencial d/dx aja sobre uma função de onda y(x) para a direita, como na Equação (13.13), 


portanto, 


d d 
dg (TP) = UP AP (13.17) 


pela regra do produto. Descartando a função de onda y da Equação (13.17), reescrevemos a Equação (13.17) como 


E sã = [ġe] =1, (13.18) 
dx 


uma constante, e então verificamos a Equação (13.16) diretamente expandindo o produto de operadores. A forma 
de produto da Equação (13.16), até o comutador constante, sugere a introdução de operadores não-hermitianos 


1 d 1 d 
alt= — Ta â = — Sa 
â = la =). = (+ 5). (13.19) 


com (à)! = ât, que são adjuntos um do outro. Eles obedecem às relações de comutação 


fâ, â] = Eg =1, lâ à] = 0 = [ât, ât], (13.20) 


que são características desses operadores e diretas para derivar da Equação (13.18) e 


baea e plé 


(ata + àà!) (13.21) 


e introduzimos o operador de número hermitiano N = à!à, de modo que H = N +1/2. Seja |n) uma autofunção 
de H, 
Hln) = Anlm), 


cujo autovalor À, é desconhecido neste ponto. Agora provamos a propriedade fundamental: N tem autovalores 
inteiros não-negativos 


1 
Njn) = (an= 5) im) = ni), n=0,1,2..., (13.22) 
isto é, An = n + 1/2. Uma vez que âà|n) é conjugado complexo para (nlà!, a integral de normalização 


(nlá!àln) > 0 e é finita. Por 


(àln))'aln) = (nlâtajn) = Q — 5) >0 (13.23) 
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vemos que N tem autovalores não-negativos. 
Agora mostramos que, se â|n) for não-zero, ela é uma autofunção com autovalor A, -1 = An — 1. Após 
normalizar à|n), esse estado é designado |n — 1), o que é provado pelas relações de comutação 


[N àt] = ât,  [N,â] = —â, (13.24) 


que resultam da Equação (13.20). Essas relações de comutação caracterizam N como o operador de número. Para 
ver isso, determinamos o autovalor de N para os estados à! |n) e à|n). Usando âât = N + [â ât] = N +1, 
constatamos que 


N(ãtln)) = ât (aat)jn) = ât (fà, â] + N)In) 
= à (N+Dl|n) = (an + z Ja'm = (n + Dan), (13.25) 
N (âln)) = (âât — 1)âln) = &(N — Dn) = (n — 1)âļn). 


Em outras palavras, N agindo sobre à!|n) mostra que ât elevou de uma unidade o autovalor n correspondente a 
|n), daí seu nome de operador de elevação ou criação. Aplicando à! repetidas vezes, podemos alcançar todos os 
estados mais elevados. Não há limite superior para a sequência de autovalores. De modo semelhante, à reduz o 
autovalor n de uma unidade; daí, ele é um operador de redução (ou de aniquilação). Por conseguinte, 


an) = |n+1), âln) ~ |n—1). (13.26) 


Aplicando à repetidas vezes, podemos alcançar o estado mais baixo, ou fundamental, |0) com autovalor Ag. Não 
podemos continuar mais para baixo porque Ao > 1/2. Portanto, à[0) = 0, sugerindo que construímos 1), = |0) a 
partir da EDO de primeira ordem (fatorada) 


d 

v2ày, = (x + 2) po = 0. (13.27) 
Integrando 

vo 

Ta (13.28) 
0 

obtemos 1 

In Yo = -37 + 1n co, (13.29) 


em que cy é uma constante de integração. A solução, 
polz) = co 2, (13.30) 


é uma gaussiana que pode ser normalizada, com co = 771/4 usando a integral de erro, Equações (8.6) e (8.8). 
Substituindo 1), na Equação (13.13), encontramos 


HI0) = (ata + 5) |0) = 510) (13.31) 


portanto, seu autovalor de energia é A) = 1/2 e seu autovalor de número é n = 0, confirmando a notação |0). 
Aplicando à! repetidas vezes a o = |0}, confirma-se que todos os outros autovalores são A, = n + 1/2, o que 
prova a Equação (13.13). As normalizações necessárias para a Equação (13.26) resultam das Equações (13.25) e 
(13.23) e 

(njããt|n) = (njâtà + 1jn)=n+1, (13.32) 


mostrando 


vn + Ijin +1) = à!|n), vnjn — 1) = âļn). (13.33) 


Assim, as funções de onda de estado excitado, 1), 1)», e assim por diante, são geradas pelo operador de elevação 


1 
n) = atio) = (2 de )vola)= Bio 2 (13:34) 
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yo) 


pa) 


Figura 13.2: Funções de onda do oscilador da Mecânica Quântica: a barra mais escura sobre o eixo x indica a faixa 
permitida do oscilador clássico com a mesma energia total. 
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resultando em [e levando à Equação (13.38), mais adiante]. 


Ynl2) = NH, Na = (Pn), 


(13.35) 
em que H,„ são os polinômios de Hermite (Figura 13.2). 

Como acabamos de mostrar, os polinômios de Hermite são usados na análise dos osciladores harmônicos 
simples da Mecânica Quântica. Para uma energia potencial V = 1K2º = imw?2? força F = -VV = 
— K z2), a equação de onda de Schrödinger é 


Ro lo L 
ay V(z) + 35? V(z) = EY (z). (13.36) 


Nossa partícula oscilatória tem massa m e energia total Æ. Usando as abreviações 


Ro e 
P a (13.37) 
`= paes 
E (E) Se 


nas quais w é a frequência angular do oscilador clássico correspondente, a Equação (13.36) se torna (com 
V(z) = V(x/0) = 1b(2)) 
Pa) 
dr? 


Essa é a Equação (13.13) com À = 2n + 1. Daí (Figura 13.2), 


+ (à -22)y(x) =0. (13.38) 


pala) = 2" (ny) e H(x),| (normalizada). (13.39) 


Alternativamente, o requisito de n ser um inteiro é ditado pelas condições de contorno do sistema da Mecânica 
Quântica, 
lim V(z) =0. 


Z>T00 


Especificamente, se n — v, não-inteiro, uma solução de série de potências da Equação (13.13) (Exercício 9.5.6) 
é 2 . ~ 

mostra que H, (x) se comportará como w”e” para x grandes. Por conseguinte, as funções y, (x) e Y, (2z) 

explodirão no infinito e será impossível normalizar a função de onda Y (z). Com esse requisito, a energia E se 

torna 


E = (r+ 5) (13.40) 


Como n se estende sobre valores inteiros (n > 0), vemos que a energia é quantizada e que há uma energia mínima 


ou de ponto zero. 


1 
E = ho. (13.41) 


mín 5 
Essa energia de ponto zero é um aspecto do princípio da incerteza, um fenômeno genuinamente quântico. 
Em problemas de Mecânica Quântica, em particular em espectroscopia molecular, são necessárias inúmeras 
integrais da forma 


Exemplos parar = 1 e r = 2 (com n = m) estão incluídos nos exercícios ao final desta seção. Há um grande 
número de outros exemplos em Wilson, Decius e Cross.* 

Na dinâmica e espectroscopia de moléculas na aproximação de Born-Oppenheimer, o movimento de uma 
molécula é separado em movimento eletrônico, vibracional e rotacional. Cada átomo em vibração contribui para 
um elemento de matriz com dois polinômios de Hermite, um para seu estado inicial e outro para seu estado final. 
Assim, são necessárias integrais de produtos de polinômios de Hermite. 


4E. B. Wilson, Jr., J. C. Decius, e P. C. Cross, Molecular Vibrations, Nova York: McGraw-Hill (1955), nova tiragem, Dover (1980). 
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Exemplo 13.1.2 FÓRMULA TRIPLA DE HERMITE 
Queremos calcular a seguinte integral envolvendo m = 3 polinômios de Hermite: 


L= E ec Hy, (£)Hy, (£) Hy, (£) de, (13.42) 


— 00 


em que N; > 0 são inteiros. A fórmula (devida a E. C. Titchmarsh, J. Lond. Math. Soc. 23: 15 (1948), veja 
Gradshteyn e Ryzhik, nas Leituras Adicionais) generaliza o caso m = 2 necessário para a ortogonalidade e a 
normalização de polinômios de Hermite. Para derivá-la, começamos com o produto de três funções geradoras de 
polinômios de Hermite, multiplicamos por e? e integramos sobre x, de modo a gerar 15: 


= 2 E 2 ee 3 2 
Za =f e” JI Ut; dx = [ e j=1ti—2) +2(tıt2+tıt3+t2t3) dz 
oo j=1 — 00 


z [re?ltrtzttits+tats), (13.43) 


A última igualdade resulta da substituição y = x — 57, t; e da utilização da integral de erro E et” dy = yT, 
Equações (8.6) e (8.8). Expandindo as funções geradoras em termos de polinômios de Hermite, obtemos 


a GI ab 
B= D MININ DT EmO Hmla) Ho) do 
1,N2,N3=0 


sry Ete + tita + tats)” 
N=0 O 


ei A N! 
=vT>, NT X — (tata) (tita)”? (tata), 
N=0 


! nalnolns! 
OLmLN, LinaN 12 


usando a expansão polinomial 


yy N 
N! n n 
As == ————————— GQ ER 7 um, 
ťa I 2 nile nml À m 
j=1 


O<ni;<m e 
As potências dos t;ty precedentes se tornam 
(tita) (tita)? (tata) = t ta t3”; 


Nı = n + no, No = nı + na, N3 = n2 + ns. 
Isto é, de 
2N =2(m + n2 + na) = NM + No + N3 
resulta 


2N = 2m1 + 2N3 = 2n9 + 2N5 = 2n3 +2M, 


portanto, obtemos 
nı = N — N3, no = N — No, nz = N- N). 


3 
Os n; são todos fixos (o que torna esse caso especial e fácil) porque os N; são fixos e 2N = 3º N;, com N > 0 
i=1 
um inteiro por paridade. Daí, comparando as potências precedentes do tipo titots, 


V72N Ni !N2! Na! 
(N = Ny MN = NojlN = N3)! 


Te (13.44) 


que é a fórmula desejada. Se ordenarmos N, > Nə > Nz > 0, então resulta nı > no > ng > 0 equivalente a 
N — N3 > N — Nə > N — N; > 0, que ocorre nos denominadores dos fatoriais de 13. E 
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Exemplo 13.1.3 | Expansão DIRETA DE PRODUTOS DE POLINÔMIOS DE HERMITE. 
Por uma abordagem alternativa, agora partimos novamente da identidade de função geradora 


oo 
a 


DD Hm(0) Halo) o — tia tictê — efaltnhta) eht 
Ni, N2=0 PaA 
1,412 
É (ti +t)” À (Qtrto)” 
= bo H (e) N! D J a 
N=0 v=0 


Usando a expansão binomial e então comparando potências iguais de tıt2, extraímos uma identidade devida a E. 
Feldheim (J. Lond. Math. Soc. 13: 22 (1938)): 


mín(Nı, N2) 
Hy, (£)Hn, (x) = Ne HN + Nav yr 


v=0 


= o HAN?! ( a ) ( a Ji (13.45) 


o<v<mín(N:,N2) 


Ny Na!2” Ni + No — 2v 
Ni + No, — 2v)! N—v 


Para v = 0, o coeficiente de H y, +y, é obviamente a unidade. Casos especiais como 
H? = H +2, Hı Hə = H; + 4H, H? = H, + 8H2 + 8, Hı H; = H4 + 6H, 


podem ser derivados da Tabela 13.1 e estar de acordo com a fórmula geral do duplo produto. 

Essa fórmula compacta pode ser generalizada para produtos de m polinômios de Hermite, e isso, por sua vez, 
dá um novo resultado de forma fechada para a integral Im. 

Vamos começar com um novo resultado para 1, contendo um produto de quatro polinômios de Hermite. 
Inserindo a identidade de Feldheim para Hn, Hn, e Hyn, Hn, e usando ortogonalidade 


[0,0] 
2 
/ e” Hy, Hy, de = 725: Ni!ôn,N, 
—00 
para o produto remanescente de dois polinômios de Hermite, temos como resultado 


99 2 
nef e” Hyn, Hn, Hn, HN, da 


—00 


= 5 2” u! 


O<u<mÍn(N:ı,N2);0<v<MÍN(N3, N14) 


N- N: v N: N. ‘i —a? 
C ESAE ct 


o E V72M (N3 + Na — 2v)! N1! N2!N3!N1! 
n (M — Ns — NUM = Na +V)(M — No + v)!(N; — Ng — v)lv! 
E (13.46) 


Aqui, usamos a notação M = (N1 + No + N3 + N4)/2 e escrevemos os coeficientes binomiais explicitamente: 
portanto, 


(Ni + No — N; — N4) = M — N; — Na, 
(NM — No + N3 + N4) = M — No, 
(Na Ni + N3 +N) =M- Ni. 


NIe NIe NIe 


Pela ortogonalidade, temos u = (N1 + N2 — N3 — N4) /2 + v. O limite superior de v é mín( N3, N4, M — N1, M — 
No) = mín( N4, M — N1) e o limite inferior é máx (0, Ns + N4 — M) = 0, se ordenarmos N; > Nə > N; > Ma. 

Agora voltamos à expansão do produto de m polinômios de Hermite e ao novo resultado correspondente dela 
obtido para Im. Provamos a identidade generalizada de Feldheim 


Hn (2) Hup (a)= 5,  Hu(e)an vma» (13.47) 


Viy bm 
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em que 
m-—l 
M = 3 (N; — 2vi) + Nm, 
1=1 


por indução matemática. Multiplicando essa expressão por H'w,,,, e usando a identidade de Feldheim, acabamos 
com a mesma fórmula para m + 1 polinômios de Hermite, incluindo a relação de recursão. 


m—l 
anun = RR 7] ( Nm+1 ) ( DA Ni nu + Nm4+1 ) 


Sua solução é 


RD E | ( Ni ) ( Dj Ny — 205) + Ni ar (13.48) 


em que Os limites dos índices do somatório são 


0 < vı < míin(Nı, No), a ao E Ra 


0< vm- <L min N Sw = 2v) + Nm- ] (13.49) 


1=1 


Agora aplicamos essa identidade generalizada de Feldheim, com índices ordenados como N1 > Nə > --:.> Nm,a 

Im, agrupando Hn, : -- Hy, e usando ortogonalidade para o produto remanescente de dois polinômios de Hermite 
—1 

Hy, Hyom-1 (N; -2v:)+Nm' Isso resulta em N1 = 5375 (N; — 2v;) + Nm, fixando vm-1, € 


i—1 
L, = VTN Es TI O i+1 ) ( Dj=a(N; -= 2v;) + Ni Jam, (13.50) 


Vi 
TER Vm—1 4=2 


m—2 
0 < vo < mín(N3, N2),..., O< Vm-1 < mín (am 54 XO (N; = 2v) + Nm- ) (13.51) 
1=2 
E 
Exemplo 13.1.4 APLICAÇÕES DAS FÓRMULAS DE PRODUTO 
Para verificar a expressão Im para m = 3, notamos que o somatório Da ss com ¿— 1 = m — 2 = 1 no 
segundo coeficiente binomial em Im é vazio (isto é, zero); portanto, só Ea Ni = Nm-1 = Nə. Além disso, 


com vm-2 = V1, a soma sobre os v; é a soma sobre v2, que é fixo pela restrição imposta ao índice do somatório 
Va: Nı = Na e 2v2 + N3. Daí, Vo = (No + N3 = Nı)/2 =N— Ni, com N = (M + No + N3)/2. Isto é, só 
resta o produto em Im. Por conseguinte, a fórmula geral para Im resulta em 


- N: N. T2N N1! Nə! N3! 
L =TM 2 \ pa! = Va AUNG ; 
V2 (N — NON — No)(N — Ns)! 


que está de acordo com nosso resultado anterior do Exemplo 13.1.2. A última expressão é baseada nas seguintes 
observações. A potência de 2 tem o expoente N, + və = N. Os fatoriais dos coeficientes binomiais são 
N3 — v2 = (Ni + N3 — N2)/2 = N — No, No — v9 = (Ni + No — N3) /2 = N — N3. 

Em seguida, vamos considerar m = 4, em que até agora não ordenamos os índices de Hermite N;. A razão é que 
a expressão geral Im foi derivada com um agrupamento dos polinômios de Hermite diferente daquele do cálculo 
separado de 14 com o qual o comparamos. É por isso que teremos de permutar os índices para obter o resultado 
anterior para 1,. Essa é uma conclusão geral: diferentes agrupamentos de polinômios de Hermite dão diferentes 
permutações dos índices de Hermite no resultado geral. 

Temos dois somatórios sobre v2 € Vm—1 = V3, que é fixo por causa da restrição Ni = N5—2v54+N3—2v34+N4. 
Daí, 

v3 = 5(No + N3 + N4 — N1) — v2 = M — Ni = n2, 
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com M = (NM + No + N3 + N14). O expoente de 2 é N + v2 + v3 = M. Por conseguinte, para m = 4 Im, a 
fórmula resulta em 


N: N., N: No — 2 N: 
Ia = VT2™ N]! 5 o na o ( 2 ee ») Va!2”2v3!2”3 


v2>0 
o > 724 NU N! N3! N4!(N2 — 2v2 + N3)! 
So volvs 


(No = v2)!(N3 = vo)MNa = va) (No = N3 = 2v9 = v3)! 


so 724 Ni! N! N3!N4!(N2 + N3 — 205)! 
(No a vo)! 


w250 (N3 — va)! (N4 — v3)!vo!vs!( No Sta N; — 2v — v3)! 


D V T2M Ni! N! N3! N4! (N2 + N3 — 2v2)! 
va! (M — N es v2)!(N3 kaag v2 )!(N2 = vo)(M q No e N3 + vo)(M e N4 "= vo)! É 


v2>0 


Na última expressão substituímos v3 e usamos 


N4 — v3 = (Ni — No — N; + Na) + v2 = M — No — N; + vo, 


NM + N2 + N3- N. 
No + N3 2v2 V3 = 1t r 3 É 


v = M — N4 — nə. 


O limite superior é vo < mín( Nə, Ng, M — Nı, M — Ng) e o limite inferior é v > máx(0, Nə + Ns — M). 
Se fizermos a permutação Nə — N4, va — v, então nosso resultado anterior I4 é obtido com limite superior 
v <mín(N,,M-—N)= 5(N> + Ns + N4 — Ni) e limite inferior v > máx(0, Ns + N4 — M) = 0 porque 
Ns + N4 — Nı — No < 0 para Ni >N>N>No>0. E 

A fórmula de produto de polinômios de Hermite também se aplica a produtos de funções de onda de oscilador 
harmônico simples, des ema?/2 H nx): Hw, (x£) de, com uma diferente função exponencial de peso. Para 
avaliar tais integrais usamos a identidade generalizada de Feldheim para H'w,--- Hyn, em conjunção com a 
integral (veja Gradshteyn e Ryzhik, em Leituras Adicionais), 


mA n+1 
(TT cera 


dl-m-n a? 
2 "DM a2 — 1) J’ 


bai 1 
/ eÀ? Ha(x) Hala) da = J 


—00 


em vez da integral de ortogonalidade padrão para o produto remanescente de dois polinômios de Hermite. Aqui, a 
função hipergeométrica é a soma finita 


mín(m;n)-1 


aaa E 


v=0 


com (—-m), = (>m)(1L—-m)---(v—1-—m) e (—m)o = 1. Isso dá um resultado similar a Im um pouco mais 
complicado. 

O potencial do oscilador também é bastante empregado em cálculos de modelos a quarks de estrutura nuclear 
(modelo da camada nuclear) de hádrons e da força nuclear. 

Há uma segunda solução independente da Equação (13.13). Essa função de Hermite da segunda espécie é uma 
série infinita (Seções 9.5 e 9.6) e não tem nenhum interesse físico, ao menos até agora. 


Exercícios 
13.1.1 Admita que sabemos que os polinômios de Hermite são soluções da equação diferencial (13.13). 
Por isso, a relação de recorrência, Equação (13.3), e os valores de H,.(0) também são conhecidos. 


(a) Suponha a existência de uma função geradora 


OO 


ge) = >) ZO, 
n=0 ` 
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13.1.2 


13.1.3 


13.1.4 


13.1.5 


13.1.6 


13.1.7 


13.1.8 


13.1.9 


(b) Diferencie g(x, t) em relação a x, usando a relação de recorrência; desenvolva uma EDP de 
primeira ordem para g(x, t). 

(c) Integre em relação a x, mantendo t fixo. 

(d) Avalie g(0,t) usando a Equação (13.5). Por fim, mostre que 


glx, t) = exp(—? + 2tx). 
Ao desenvolver as propriedades dos polinômios de Hermite, parta de vários pontos diferentes, como 
1. EDO de Hermite, Equação (13.13), 
2. Fórmula de Rodrigues, Equação (13.7), 
3. Representação integral, Equação (13.8), 
4. Função geradora, Equação (13.1), 
5. Construção de Gram-Schmidt de um conjunto completo de polinômios ortogonais sobre 
(—00, 00) com um fator de peso de exp(—x2), Seção 10.3. 


Explique como você pode ir de qualquer um desses pontos de partida para todos os outros pontos. 


(2 = =) 1 = Hu(a). 


Sugestão: Verifique o primeiro par de exemplos e então use indução matemática. 


Prove que 


Prove que 


Reescreva a forma de série de H, (x), como uma série de potências ascendentes. 


ja Res n - 2s 2s (2n)! 
Resposta: Hon(a) = (—1) Ao) (2x) En s)! 
Hona) = (—1)” 5 (1) (22)! 
s=0 
(a) Expanda z?” em uma série de polinômios de Hermite de ordem par. 
(b) Expanda x2"+! em uma série de polinômios de Hermite de ordem ímpar. 


(2n + 1)! 
(2s + 1)!(n — s)! 


Resposta: (a) x?” = 


(2r)! É Hon(a) 
227 e (2n)!(r — n)! 


n=0 
(2r +1)! < Honi (£) 


b) z?” +1 = =0,1,2,... 
(b) x 22741 A e e o r=0,1,2, 


P a 3 


Sugestão: Use a representação de Rodrigues e integre por partes. 


Mostre que 


(a) o Ha(x) exp 5] de = RR n par 


0, n ímpar. 


oo r? Ea 
(b) E xH, (x) exp -5] dy = TES 


n ímpar. 


Mostre que 


Mostre que essa integral é igual a 1!/22"Inlôn-1 + 11/22" (n + 1)!ômn41. Esse resultado 
mostra que tais transições podem ocorrer somente entre estados de níveis de energia adjacentes, 
m=n+l. 
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Sugestão: Multiplique a função geradora (Equação (13.1)) por si mesma usando dois conjuntos 
diferentes de variáveis (x, s) e (x,t). Alternativamente, o fator x pode ser eliminado pela relação 
de recorrência, Equação (13.2). 


13.1.10 Mostre que 
j 1 
1 xe” Ha(x) Hn (2) da = 11/29"! (1 + 5) 


Essa integral ocorre no cálculo do deslocamento médio quadrático de nosso oscilador quântico. 
Sugestão: Use a relação de recorrência, Equação (13.2) e a integral de ortogonalidade 


13.1.11 Avalie 


em termos de n e m e das funções delta de Kronecker adequadas. 
Resposta: gn-1q1/2 (2n + Dnlônm + 9" q1/2(m + 2)!0n+2m + o sa 
13.1.12 Mostre que 


É ret = Jo, p> 
J. Te Ha(r) Hnp(x) da = als p=r, 


com n, p e r inteiros não-negativos. 
Sugestão: Use a relação de recorrência, Equação (13.2), p vezes. 


13.1.13 (a) Usando a fórmula integral de Cauchy, desenvolva uma representação integral de Hn (x) baseada 
na Equação (13.1) com o contorno circundando o ponto z = — zx. 


n! 22 ef 
Resposta: Ha(s) = DAS f GF aj dz. 
(b) Mostre por substituição direta que esse resultado satisfaz a equação de Hermite. 


13.1.14 Com 
Hn (£) 


BEN —q2/2 
Yalx) =E (22n!r1/2)1/2? 


verifique que 


antala) = Sa (24 E Yn) = nbr ala) 


` a d T. 1/2 
iltnla) = Ss (2 5) bato) = 4 Dolo 


Nota: A abordagem usual de operador da Mecânica Quântica estabelece essas propriedades de 
elevação e redução antes da forma de 1/,, (x) ser conhecida. 


13.1.15 (a) Verifique a identidade do operador 


dos vt] do q? 
mar aSa | SD 


(b) A função de onda de oscilador harmônico simples normalizada é 


vala) = (m/22"n!) “exp -Fma 


Mostre que essa expressão pode ser escrita como 


T 12 ( E =) exp E 


Nota: Isso corresponde a aplicar n vezes o operador de elevação do Exercício 13.1.14. 
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13.1.16 


13.1.17 


13.1.18 


13.1.19 


13.1.20 


13.1.21 


(a) Mostre que a hamiltoniana de oscilador simples (da Equação (13.38) pode ser escrita como 


1d? E E Aik 
H= amo T 3" = z (ãa! + âtâ). 


Sugestão: Expresse E em unidades de fw. 
(b) Usando a formulação de operador de criação-aniquilação da parte (a), mostre que 


nula) = (n+ 5 ) ota) 


Isso significa que os autovalores de energia são E = (n + 5)(hw), de acordo com a 
Equação (13.40). 
Escreva um programa para gerar os coeficientes as, na forma polinomial do polinômio de Hermite 
El E ans 
A função f(x) é expandida em uma série de Hermite 


Hx) = 5 an Hn (2). 
n=0 
Pela ortogonalidade e normalização dos polinômios de Hermite, o coeficiente an é dado por 


1 so ds 
an = zom l H(a)Ha(a)e ” da. 


Determine os coeficientes de Hermite a, pela quadratura de Gauss-Hermite para f(x) = xë. 


Compare os coeficientes que encontrou com AMS-55, Tabela 22.12 (referência dada na nota de 
pé de página 4 no Capítulo 5 ou em Referências Gerais no final do livro). 


(a) Por analogia com o Exercício 12.2.13, estabeleça a matriz de coeficientes pares de polinômios 
de Hermite que transformarão uma série de Hermite par em uma série de potências pares: 


1 -2 12 
0 4 -48 
B=| o 0o 16 


Estenda B para manipular uma série polinomial até Hs (x). 

(b) Inverta sua matriz para obter A, que transformará uma série de potências pares (até xë) em uma 
série de polinômios pares de Hermite. Compare os elementos de A com os listados em AMS-55 
(Tabela 22.12, em Referências Gerais no final do livro). 

(c) Por fim, usando multiplicação de matrizes, determine a série de Hermite equivalente a f(x) = 


zë. 


Escreva uma sub-rotina para transformar uma série finita de potências, o anx”, em uma série 
de Hermite, Es bn Hn (£x). Use a relação de recorrência, Equação (13.2). 
Nota: Exercícios 13.1.19 e 13.1.20 são mais rápidos e mais precisos do que a quadratura de Gauss, 
Exercício 13.1.18, se f(x) estiver disponível como uma série de potências. 


Escreva uma sub-rotina para avaliar elementos de matriz do polinômio de Hermite da forma 
pe 2 
Mpar = / Ho(x)Hy(uo)x"e ” dz, 
— oo 


usando a quadratura de Gauss-Hermite de 10 pontos (para p + q + r < 19). Inclua uma verificação 
de paridade e iguale a zero as integrais com integrando de paridade ímpar. Além disso, verifique 
se r está no intervalo |p — q| < r. Caso contrário, Mpar = 0. Compare seus resultados com casos 
específicos listados nos Exercícios 13.1.9, 13.1.10, 13.1.11 e 13.1.12. 
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13.1.22 Calcule e tabule as funções de onda normalizadas do oscilador linear 


2 
Y, (a) = 2" (ay H, (x) ep(-5), para x = 0,0(0,1)5,0 
e n = 0(1)5. Se dispuser de uma rotina de montagem de gráficos, faça um gráfico com seus 


resultados. 

13.1.23 Avalie [E e727" Hy, (x): -- Hy, (x) de em forma fechada. 
Sugestão: [S e7?” Hy, (£)Hn,(£)Hyn(£)dæ = 420N1+N2+Ns—1)/2 . P(s — NyT(s — N2) 
-T(s — Ns)s = (Mi + N + Ns + 1)/2 ou [S e” Hy, (£)Hn,(£)de = 
(—1) (Mi +N2—1)/22(N1+N2—1)/2 . D((N, + No + 1)/2) podem ser úteis. Prove essas fórmulas (veja 
Gradshteyn e Ryzhik, nº 7.375, em Leituras Adicionais). 


13.2 Funções de Laguerre 


Equação Diferencial — Polinômios de Laguerre 
Se começarmos com a função geradora adequada, é possível desenvolver os polinômios de Laguerre por analogia 
com os polinômios de Hermite. Uma alternativa seria desenvolver uma solução de série pelos métodos da Seção 
9.5. Em vez disso, vamos ilustrar uma técnica diferente começando com a EDO de Laguerre e obtendo uma solução 
na forma de uma integral, de contorno, como fizemos com a representação integral, para a função modificada de 
Bessel K, (x) (Seção 11.6). Partindo dessa representação integral, será derivada uma função geradora. 

A EDO de Laguerre (que deriva da EDO radial da EDP de Schrödinger para o átomo de hidrogênio) é 


ay" (x) + (1 — x)y' (x) + ny(x) = 0. (13.52) 


Tentaremos representar y, ou melhor, yn, uma vez que y dependerá do parâmetro n, um inteiro não-negativo, pela 


integral de contorno 
1 e727/(1—2) 
Yn(x) = f / d (13.53a) 


2ri 1— 2)2M+ A 


e demonstrar que ela satisfaz a EDO de Laguerre. O contorno inclui a origem mas não circunda o ponto z = 1. 
Diferenciando a exponencial na Equação (13.53a), obtemos 


f 1 e727/(1-2) 

Yn(2) = T) = ado (13.53b) 
y 1 e727/(1—2) 

ys (x)= T TE SUE (13.530) 


Substituindo no lado esquerdo da Equação (13.52), obtemos 


1 x l-r n 
—u2/(1-2) q 
m fla — z)’ (1-2) į (1 | o 


1 d e77z7/(1-2) 
dz. 13.54 
mf Elo 3 ( ) 
Se integrarmos nossa diferencial exata ao redor de um contorno fechado (Figura 13.3), a integral desaparecerá, 


verificando, desse modo, que yn (x) (Equação (13.53a)) é uma solução da equação de Laguerre. 
Tornou-se costumeiro definir L, (x), o polinômio de Laguerre (Figura 13.4), por” 


que é igual a 


A f E (13.55) 
REA 2mi) (1— z)z”+t i É 


* Há outras definições de Ln (x) em uso. Aqui, as definições do polinômio de Laguerre Ln (x) e do polinômio associado de Laguerre LE (x) 
estão de acordo com AMS-55, Capítulo 22. (A referência completa é dada na nota de rodapé 4 do Capítulo 5 ou em Referências Gerais no final 
do livro.) 
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x 
H 
= 


Figura 13.3: Contorno do polinômio de Laguerre. 


E exatamente isso que obteríamos da série 


—az/(1-2) eo 
e n 
g(x, z) = =i Du Tula) ) lz| <a, (13.56) 


se multiplicássemos g(x, z) por 2"! e integrássemos ao redor da origem. Assim como no desenvolvimento do 


cálculo de resíduos (Seção 7.1), somente o termo z7! da série sobrevive. Tendo isso como base, identificamos 
g(x, z) como a função geradora para os polinômios de Laguerre. 


LO) 


Com a transformação 


—— =s—& ou p= ` (13.57) 


e” sre? 
Lala) = i f CEE ds, (13.58) 


o novo contorno que circunda o ponto s = x no plano s. Pela fórmula integral de Cauchy (para derivadas), 


e” d” 
Talia n! dz” 


(ae?) (n inteiro), (13.59) 
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dando a fórmula de Rodrigues para polinômios de Laguerre. Por essas representações de L, (x) encontramos a 
forma de série (para n inteiro), 


n (DN nla” n (—1)"=Snlar—s 
= (n — m)!'m!m! no (n — s)!(n — s)!s! ’ (1400) 


e os polinômios específicos listados na Tabela 13.2 (Exercício 13.2.1). Está claro que a definição de polinômios 
de Laguerre nas Equações (13.55), (13.56), (13.59) e (13.60) é equivalente. Aplicações práticas decidirão qual 
abordagem usaremos como nosso ponto de partida. A Equação (13.59) é muito conveniente para gerar a Tabela 
13.2, a Equação (13.56) para derivar relações de recorrência a partir das quais a EDO Equação (13.52) é recuperada. 


Tabela 13.2 Polinômios de Laguerre 


5!Ls(x) = — x5 + 25x4 — 20022 + 600x? — 600x + 120 


(x) 
(x) 
4!La(x) = z4 — 16r? + 72x? — 96x + 24 
(x) 
6!Le(x) = xê — 36x5 + 4504! — 2400x? + 5400x? — 43207 + 720 


Por diferenciação da função geradora na Equação (13.56) em relação a x e z, obtemos relações de recorrência 
para os polinômios de Laguerre, como descrevemos a seguir. Usando a regra do produto para diferenciação, 
verificamos as identidades 


(9) ð 
a= (l-z zole) e- 1)5E = zole). (13.61) 


Escrevendo os lados esquerdo e direito da primeira identidade em termos de polinômios de Laguerre usando a 
Equação (13.56), obtemos 


(1-2? 


> (mn + DLasa(a) — 2n Ln (x£) + (n — Diet] 
= S0 = x)Ln (£) — Ln-1(2)] 2”. 


Igualando coeficientes de z”, temos como resultado 
(n + DLasai(x) = (2n + 1 — x)Ln (£) — nLn-1 (£). (13.62) 


Para obter a segunda relação de recursão, usamos ambas as identidades das Equações (13.61) para verificar a 
terceira identidade, 


dg g eg) 
Toz “Bs Žž de? (13.63) 


que, quando escrita da mesma forma em termos de polinômios de Laguerre, verificamos ser equivalente a 


xL! (x) = nLn(x) — nLa-(2). (13.64) 
A Equação (13.61), modificada para ser lida como 
1 
Lasi(x) = 2Ln(x) — Ln-1 (£) — EA [(1 + £)Ln(£) — Ln- (£)], (13.65) 


2 


por razões de economia e estabilidade numérica, é usada para cálculo de valores numéricos de Ln(x). O 
computador começa com valores numéricos conhecidos de Lo(x) eLı (x), Tabela 13.2, e prossegue passo a passo. 
Essa é a mesma técnica discutida para o cálculo de polinômios de Legendre, Seção 12.2. 

Além disso, pela Equação (13.56) encontramos 


oO oO 


9(0,2) = 1 4 ia 5 zaz 5 La(0)2”, 
n=0 n=0 
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que dá como resultado os valores especiais de polinômios de Laguerre 
Ln(0) = 1. (13.66) 


Como vemos pela forma da função geradora, pela forma da EDO de Laguerre ou pela Tabela 13.2, os polinômios 
de Laguerre não têm nem simetria ímpar nem simetria par sob a transformação de paridade x — — z. 

A EDO de Laguerre não é auto-adjunta, e os polinômios de Laguerre L, (a) por si mesmos não formam um 
conjunto ortogonal. Todavia, seguindo o método da Seção 10.1, se multiplicarmos a Equação (13.52) por e” 
(Exercício 10.1.1), obtemos 


Re e” Lm(£)Ln(x) de = ômn- (13.67) 
0 


Essa ortogonalidade é uma consequência da teoria de Sturm-Liouville, Seção 10.1. A normalização resulta da 
função geradora. Às vezes é conveniente definir funções ortogonalizadas de Laguerre (com a função de peso 
unitária) por 

pala) = e Lala). (13.68) 


Nossa nova função ortonormal, o, (2), satisfaz a EDO 


x 


vol (z) + pala) + (r + E = z Jale) =0, (13.69) 


que verificamos ter a forma (auto-adjunta) de Sturm-Liouville. Note que o intervalo (0 < £ < 00) foi usado porque 
as condições de fronteira de Sturm-Liouville são satisfeitas em suas extremidades. 


Polinômios Associados de Laguerre 
Em muitas aplicações, em particular em Mecânica Quântica, precisamos dos polinômios associados de Laguerre 
definidos por 


d* 
LE (x) = (Dt Tnen(a). (13.70) 


Pela forma de série de Ln (x), verificamos que os polinômios associados de Laguerre mais baixos são dados por 


Lo(a)=1, 
Lk(z)=-2+k+41, 
A r? (k+2)(k+1) 
Lje palk eke (13.71) 
Em geral, 
Li(a)=5 (-1) GER k >-1. (13.72) 


m=0 


Pode-se desenvolver uma função geradora diferenciando a função geradora de Laguerre k vezes para obter como 
resultado 


ACO ps E bnala)" = SO LE (a)r tt 
( ) Trk =( ) À qa n+k(£)z => n(£)z 


l-z 
K z k euz/(1-2) 
“Al-sz l-z ` 


Pelos dois últimos membros dessa equação, cancelando o fator comum 2”, obtemos 


—az/(1—2) œO 

e 

= 97 Do Lilo)”, z| <1. (13.73) 
n=0 


é Alguns autores usam ah (x) = (d? /dx")[Ln+k(£)]. Daí, nossa LE (x) = (IL (a). 


“livro” — 2007/8/1 — 15:06 — page 637 — #647 


13. MAIS FUNÇÕES ESPECIAIS 637 


ELSEVIER 


Por essa expressão, a expansão binomial para x = 0, 


1 2 /-k-1 ec e 
(1 EO po ( j ) (=2)" = X Li(o)z 
n=0 n=0 
resulta em i 
L} (0) = o (13.74) 


Podem-se derivar relações de recorrência a partir da função geradora ou por diferenciação das relações de 
recorrência do polinômio de Laguerre. Entre as numerosas possibilidades estão 


(n+ DIB (x) = (2n +k +1- r)L} (x) — (n + k)LE_ (x), (13.75) 
k 
2u = nLk(x) — (n + k)LE_; (£x). (13.76) 


Assim, diferenciando a EDO de Laguerre uma vez, obtemos 


dL! dL, dL 
n e s L 1 n n = 0 
T dx + n n ay ( x) dx +n dz , 


e, diferenciando a EDO de Laguerre k vezes, por fim obtemos 


k dt—1 dt—1 d* d* 
q ln + Rai ln k Li, + (1—1) Lh +n- Ln =0. 


É dyk-1 dk das 


Ajustando o índice n — n + k, temos a EDO associada de Laguerre 


dL} (x) 
dx 


vo?" + (k+1-2) + nlk (a) = 0. (13.77) 
L 


Quando polinômios associados de Laguerre aparecem em um problema físico, em geral é porque o problema em 
questão envolve a Equação (13.77). A aplicação mais importante é nos estados ligados do átomo de hidrogênio 
que são derivados no Exemplo 13.2.1 mais adiante. 
Pode-se obter uma representação de Rodrigues do polinômio associado de Laguerre 
e” xE d” 


LE (a) = (ent. (13.78) 


n! da” 


substituindo a Equação (13.59) na Equação (13.70). Note que todas essas fórmulas para polinômios associados de 
Legendre LË (x) se reduzem às expressões correspondentes para L, (1), quando k = 0. 

A equação associada de Laguerre, Equação (13.77), não é auto-adjunta, mas pode ser colocada em forma auto- 
adjunta, multiplicando por e” x”, que se torna a função de peso (Seção 10.1). Obtemos 


(n+ k)! 


/ eT” x" LE (x) LE (x) de = Orini: (13.79) 


A Equação (13.79) mostra o mesmo intervalo de ortogonalidade (0, oo) dos polinômios de Laguerre, mas, com uma 


nova função de peso, temos um novo conjunto de polinômios ortogonais, os polinômios associados de Laguerre. 
Fazer y (x) = e7®/?x¥/2 LE (x), Yë (x) satisfaz a EDO auto-adjunta 


Pita) dyž (æ) £ 2n+k+1 RN 
eo +( E 5 E) vita) =0. (13.80) 


As yE (x) às vezes são denominadas funções de Laguerre. A Equação (13.67) é o caso especial k = 0 da 
Equação (13.79). 
Uma outra forma útil é dada definindo” 


dk (x) = e 7/2 +D/2 Lk (g), (13.81) 


"Isso corresponde a modificar a função y na Equação (13.80) para eliminar a derivada de primeira ordem (compare com o Exercício 9.6.11). 
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Substituição na equação associada de Laguerre, resulta em 


dk (a) = 0. (13.82) 


d2 db (x) 1 2n+k+1 k? —1 
dx? 4 2x 4x2 


A integral de normalização correspondente [1º |Ð} (x)|? da é 


m eat [Ek (x)]’ da = E Hon + k+ 1). (13.83) 
o ! 


Observe que as &* (x) não formam um conjunto ortogonal (exceto com x! como uma função de peso) por causa 
do x”! no termo (2n + k + 1) /2x. (As funções de Laguerre Lt (x) nas quais os índices v e u são não são inteiros 


podem ser definidas usando as funções hipergeométricas confluentes da Seção 13.5.) 


Exemplo 13.2.1  Áromo pe Hinrocênio 
A aplicação mais importante dos polinômios de Laguerre é na solução da equação de Schrödinger para o átomo de 
hidrogênio. Essa equação é 


h2 Ze? 
Vy — 2º p= Eb, (13.84) 
2m 47e0r 


na qual Z = 1 para hidrogênio, 2 para hélio ionizado, e assim por diante. Separando variáveis, constatamos que a 
dependência angular de 1) são os harmônicos esféricos Y 7” (0, p). A parte radial, R(r), satisfaz a equação 


R= ER. (13.85) 


2m r2 dr r dr 2 


Rad ( A Ze p, Ë IL+1) 


4TEor 2m r 


Para estados ligados, R — 0, quando r — œ, e R é finito na origem, r = 0. Não consideramos estados contínuos 
com energia positiva. Somente quando eles estiverem incluídos é que as funções de onda do hidrogênio formam 
um conjunto completo. 

Usando abreviações (resultantes de aumentar novamente r até a variável radial sem dimensão p) 


8mE mZe? 
cs Dep — E 
p= ar, com aí = FER E <0, moan?’ (13.86) 
a Equação (13.85) se torna 
1 d / odx(p) à 1 I(L+1) 
=0 13.87 
Ro (o Ro ka l à x(9) =0, (13.87) 


em que x(9) = R(p/a). Uma comparação com a Equação (13.82) para E(x) mostra que a Equação (13.87) é 
satisfeita por 
px(p) = eP p t LRE] (p), (13.88) 


na qual k é substituído por 2L + 1 por n by À — L — 1, pela utilização de 
1 d ody 1 @ 

p = 
Pdp dp pdp 


Devemos restringir o parâmetro À impondo que ele seja um inteiro n, n = 1, 2,3, . . .& Isso é necessário porque 
a função de Laguerre de n não-inteiro divergiria? como p”e”, o que é inaceitável para nosso problema físico, no 
qual 
lim R(r) = 0. 


F00 


Essa restrição a À, imposta por nossa condição de contorno, tem o efeito de quantizar a energia, 


Zm / e N? 
n=- (=) (13.89) 


SEssa é a notação convencional para À. Esse n não é o mesmo índice n em DF (x). 
9Tsso pode ser mostrado, como no Exercício 9.5.5. 
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O sinal negativo reflete o fato de que, aqui, estamos tratando com estados ligados (E < 0), que correspondem a 
um elétron que não consegue escapar até o infinito, onde o potencial de Coulomb cai a zero. Usando esse resultado 
para E,,, temos 


me? Z 24 24% 
= naa = —— 13.90 
2regh2 n nag’ P nao é ( ) 
com 
4regh? 
0 = E , o raio de Bohr. 
me 


Assim, a função de onda do hidrogênio normalizada final é escrita como 


turno 0,9) (2) SE e cor ar IREL (ar) YA (O, o). 


nao n+ L) 
(13.91) 
Existem soluções regulares para n > L + 1, portanto, o estado mais baixo com L = 1 (denominado estado 2P) 
ocorre somente com n = 2. E 
Exercícios 


13.2.1 Mostre, com o auxílio da fórmula de Leibniz, que a expansão de série de L, (x) (Equação (13.60)) 
resulta da representação de Rodrigues (Equação (13.59)). 


13.2.2 (a) Usando a forma de série explícita (Equação (13.60)), mostre que 


Lilo) =n, 


L} (0) = n(n — 1). 


(b) Repita sem usar a forma de série explícita de Ln (x). 


13.2.3 Derive a representação de Rodrigues 


a partir da função geradora. 
13.2.4 Derive a relação de normalização (Equação (13.79)) para os polinômios associados de Laguerre. 


13.2.5 Expanda x” em uma série de polinômios associados de Laguerre L} (x), k fixo e n na faixa de O a 
r (ou a œ se r não for um inteiro). 
Sugestão: A forma de Rodrigues de LE (x) será útil. 


DP LE (x 
Resposta: x” = (r + k)!r! 2 o T 0O<a<o. 
(r-n 


13.2.6 Expanda e—“” em uma série de polinômios associados de Laguerre L& (x), k fixo e n na faixa de O 
a oo. 


(a) Avalie diretamente os coeficientes na expansão que você supôs. 
(b) Desenvolva a expansão desejada a partir da função geradora. 
—aa 1 a ” k 
Resposta: e = UFak EF Lila), 0 < x < 00. 
n=0 
13.2.7 — Mostre que 


/ LL (x) dz = Dom +k+1). 
0 n! 


Sugestão: Note que 


TI = (2n + k + DI — (n + k)L¥_ — (n + 1)LE 1. 


640 
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13.2.8 


13.2.9 


13.2.10 


13.2.11 


Suponha que um problema particular em Mecânica Quântica resultou na EDO 


d2y k?—1 2ntk+1 1 E 
dr? 472 dx 47 


para inteiros não-negativos n, k. Escreva y(x) como 


impondo os requisitos de que: 


(a) A(x) seja uma exponencial negativa que dá o comportamento assintótico requerido de y(x); e 
(b) B(x) seja uma potência positiva de x que dá o comportamento de y(x) para 0 < x < 1. 


Determine A(x) e B(x). Ache a relação entre C(x) e o polinômio associado de Laguerre. 
Resposta: A(x) = e7®/?,  B(æ)=g%t9/2, (x) = L5 (x). 


Pela Equação (13.91), a parte radial normalizada da função de onda do hidrogênio é 


a(n- L-1)! 


1/2 
maro) ONE) 


Rnz(r) = jo 


na qual a = 2Z/nag = 2Z2me? /4negh?. Avalie 


(a) (r) = E rRar(ar)Rnz(ar)r? dr, 
0 


(b) (rs = e r`! Ra(ar)Raz(or)r? dr. 
0 


A quantidade (r) é o deslocamento médio do elétron em relação ao núcleo, enquanto (r7!) é a 
média do deslocamento recíproco. 
1 


n?ao i 


Resposta: (r) = > [8n? — L(L + 1)], (r71) = 
Derive a relação de recorrência para os valores esperados da função de onda do hidrogênio 


s+2 
2 


1 
(1H) — (2s + 3)ag(r') + Z (2L +1)? — (s + 1)°ļ]a3(r5™t+} = 0, 
n 
com s > —2L — 1, (r) = r°. 
Sugestão: Transforme a Equação (13.87) em uma forma análoga à Equação (13.80). Multiplique 
por pê°t?u’ — cp°tlu. Aqui, u = pẹ. Ajuste c para cancelar termos que não resultam em valores 


esperados. 


As funções de onda do hidrogênio, Equação (13.91), são mutuamente ortogonais, como devem ser, 
uma vez que são autofunções da equação auto-adjunta de Schrödinger 


* 2 o 
J Vati bmatama dr dQ = Ônina0L1 L2ÔMı M2- 


Ainda assim, a integral radial tem a forma (enganadora) 


r Ear PES larje? (ar)” LET (ar)r? dr, 
0 


que parece concordar com a Equação (13.83) e não com a relação de ortogonalidade associada de 
Laguerre, Equação (13.79). Como você resolve esse paradoxo? 


Resposta: parâmetro a depende de n. Os primeiros três a, previamente 
mostrados, são 2Z/nijag. Os três últimos termos são 
2Z/noa0. Para ny = no, a Equação (13.83) se aplica. Para 
nı Æ n2, nem a Equação (13.79) nem a Equação (13.83) são 
aplicáveis. 


ELSEVIER 
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13.2.12 


13.2.13 


13.2.14 


13.2.15 


13.2.16 


13.2.17 


13.2.18 


13.2.19 


13.2.20 


13.2.21 


A análise da Mecânica Quântica do efeito de Stark (coordenada parabólica) leva à EDO 


d /_du 1 m? lae) O 
A Ea r a )u=0. 


Aqui, F é uma medida da energia de perturbação introduzida por um campo elétrico externo. Ache 
as funções de onda não-perturbadas (F = 0) em termos de polinômios associados de Laguerre. 


Resposta: u(£) = eTeê/2gm/2 LM (cg), com £ = y—2E > 0, 
p= L/e — (m + 1)/2, um inteiro não-negativo. 

A equação de onda para o oscilador harmônico tridimensional é 

w apa Mar Ey 

—— = ryp = à 

2M pe 
Aqui, w é a frequência angular do oscilador clássico correspondente. Mostre que a parte radial de y% 
(em coordenadas polares esféricas) pode ser escrita em termos de funções associadas de Laguerre 
de argumento (372), em que 8 = Mw/h. 
Sugestão: Como no Exercício 13.2.8, separe os fatores radiais de r! e emBrê/2 A função associada 


de Laguerre terá a forma PE EE (Br). 


Escreva um programa de computador para gerar os coeficientes as na forma polinomial do 


polinômio de Laguerre La (£) = 50 


Qi. 
2... . A . N 
Escreva um programa de computador para transformar uma série finita de potências 51, q ana” 
poa N z aan = 
em uma série de Laguerre 3, —o bnLn(x). Use a relação de recorrência, Equação (13.62). 


Tabule Lio(x) para x = 0,0(0,1)30,0. Isso incluirá as 10 raízes de L1o. Passando de q = 
30,0, Lio(x) é monotônica crescente. Se houver um software gráfico disponível, monte um gráfico 
com seus resultados. 


Valor de verificação. Oitava raiz = 16, 279. 


Determine as 10 raízes de L1o(x) usando software de procura de raízes. Você pode usar o que sabe 
da localização aproximada das raízes ou desenvolver uma rotina de busca para procurar as raízes. As 
10 raízes de Lio(x) são os pontos de avaliação para a quadratura de Gauss-Laguerre de 10 pontos. 
Verifique os valores que obteve comparando-os com AMS-55, Tabela 25.9. (A referência é dada na 
nota de rodapé 4 no Capítulo 5 ou em Referências Gerais no final do livro.) 


Calcule os coeficientes de uma expansão de série de Laguerre (L,(x),k = 0) da exponencial 
e”. Avalie os coeficientes pela quadratura de Gauss-Laguerre (compare com a Equação (10.64)). 
Verifique os resultados que obteve comparando-os com os valores dados no Exercício 13.2.6. 
Nota: Aplicação direta da quadratura de Gauss-Laguerre com f(x)L,(x)e”” dá má precisão por 
causa do e” extra. Experimente uma mudança de variável, y = 2x, de modo que a função que 
aparece no integrando será simplesmente L, (1/2). 


(a) Escreva uma sub-rotina para calcular os elementos da matriz de Laguerre 
OO 
Madre / Ln(x)Ln(a)aPe * de. 
0 


Inclua uma verificação da condição |m — n| < p < m + n. (Se p estiver fora dessa faixa, 
Mmnp = 0. Por quê?) 
Nota: Uma quadratura de Gauss-Laguerre de 10 pontos dará resultados precisos para 
m+n+p< 19. 
(b) Chame sua sub-rotina para calcular vários elementos da matriz de Laguerre. Verifique Mmn1 
comparando com o Exercício 13.2.7. 
Escreva uma sub-rotina para calcular o valor numérico de LE (x) para valores especificados de n, k, 
e x. Imponha que n e k sejam inteiros não-negativos e x > 0. 
Sugestão: Partindo de valores conhecidos de LE e Lk(a), podemos usar a relação de recorrência, 
Equação (13.75), para gerar LE (x), n = 2,3,4,... 


Mostre que ga ane?” Ha(vy) de = yrn!P, (y), em que P, é um polinômio de Legendre. 
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13.2.22 Escreva um programa para calcular a função de onda radial normalizada do hidrogênio 1), (r). 
Essa é a 1,1 da Equação (13.91), omitindo o harmônico esférico Y/” (0, p). Considere Z = 1 
e ao = 1 (o que significa que r está sendo expresso em unidades de raios de Bohr). Considere n 
e L como dados de entrada. Tabule 1,7 (7) para r = 0,0(0,2)R com R suficientemente grande 
para exibir os aspectos significativos de 1), o que quer dizer aproximadamente R = 5, para n = 1, 
R = 10, para n = 2 e R = 30, para n = 3. 


13.3 Polinômios de Chebyshev 


Nesta seção são desenvolvidos dois tipos de polinômios de Chebyshev como casos especiais de polinômios ultra- 
esféricos. Suas propriedades resultam da função geradora polinomial ultra-esférica. A importância primária dos 
polinômios de Chebyshev é em análise numérica. 


Funções Geradoras 
Na Seção 12.1 foi mencionada a função geradora para os polinômios ultra-esféricos ou de Gegenbauer, 


Eee eo CÍ (a 1 t|<1 13.92 
TED -5 >» ll<i il< (13.92) 


com Q = 5 dando origem aos polinômios de Legendre. Nesta seção, primeiro consideramos a = 1 e, em seguida, 
a = 0, para gerar dois conjuntos de polinômios conhecidos como os polinômios de Chebyshev. 

Tipo II 

Coma=1e cP (a) = Un(a), a Equação (13.92) resulta em 


= -Pune o de[<1, fal (13.93) 


Essas funções U, (x) geradas por (1 —2xt+t?) ~t são denominadas polinômios de Chebyshev tipo II. Embora esses 
polinômios tenham algumas aplicações em Física Matemática, uma aplicação não-usual é no desenvolvimento de 
harmônicos esféricos quadridimensionais usados na teoria do momento angular. 


Tipo I 
Com a = 0 há uma dificuldade. De fato, nossa função geradora se reduz à constante 1. Podemos evitar esse 
problema primeiro diferenciando a Equação (13.92) em a t, o que resulta em 


= e = 3 net ato), (13.94) 
ou a 
v—t E n[ CO (x z 
(1— 2ut + BJ O > 2 | K |e E (13.95) 
Definimos CS) (a) por 
Cw (x) 


CO (x) = lim 


a=>0 Q 


(13.96) 


A finalidade de diferenciar em relação a t era obter œ no denominador e criar uma forma indeterminada. Agora, 
multiplicando a Equação (13.95) por 2t e adicionando 1 = (1 — 2xt + t2)/(1 — 2xt + t2), obtemos 


1—t2 (o 
ra 1+2D5 CO (x (13.97) 


Definimos T,. (x) por 


1, n=0 
Ta(x) = (cinto, SO (13.98) 
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Observe o tratamento especial para n = 0. É similar ao tratamento do termo n = O nas séries de Fourier. Note 
também que co) é o limite indicado na Equação (13.96) e não uma substituição literal de a = O na série da função 
geradora. Com esses novos rótulos, 


1- < 
e Sh 2 Tat”, <1, t| <1. 13. 
amo = Tola) + > (2) lol < t| < (13.99) 


Denominamos T, (x) aos polinômios de Chebyshev tipo I. Observe que a notação e a grafia do nome dessas funções 
é diferente, dependendo da referência. Aqui, utilizamos a grafia recomendada em AMS-55 (a referência completa 
é dada na nota de rodapé 4 no Capítulo 5). 

Diferenciando a função geradora (Equação (13.99)) em relação a t e multiplicando pelo denominador, 
1 — 2xt + t2, obtemos 


—t—(t—a)] To(x) +2 D Tn(æ)t” | = (1 — 2xt + t°) S nTn (x)! 


n=1 


E 5 [nTat" T] — 2an Tnt” + nne 


n=1 
da qual resulta a relação de recorrência 
Tara (x) — 22Ta(1) + Tail) = 0 (13.100) 


deslocando o índice do somatório, de modo a obter a mesma potência, t”, em cada termo e então comparando 
coeficientes de t”. Tratando a Equação (13.93) de modo semelhante, encontramos 


2(t— x) 2 O -1 
= (1—2rt+t Di E 
re (Lo dat+ P>, (2) 
da qual resulta a relação de recursão 
Una (a) — 21Un (£) + Un-(a) = 0 (13.101) 


pela comparação de coeficientes da mesma potência de t (veja a Tabela 13.3). 


Tabela 13.3 Relação de recursão” 
Pan(a) = (Ant + Bn)Pal£) — CaPa-a(a) 


Legendre Pala) Sato 0 = 
Chebyshev I Tala) 2 0 1 
Chebyshev I deslocada Ti(ax) 4 —2 1 
Chebyshev II Un(a) 2 0 1 
Chebyshev II deslocada Uš (x) 4 —2 1 
Laguerre associada g (x) = PHH att 
Hermite Ha(a) 2 0 2n 


P, denota qualquer dos polinômios ortogonais. 


Então, usando as funções geradoras para os primeiros valores de n e essas relações de recorrência para os 
polinômios de ordem mais alta, obtemos as Tabelas 13.4 e 13.5 (veja também as Figuras 13.5 e 13.6). 

Do mesmo modo que para os polinômios de Hermite, Seção 13.1, as relações de recorrência, Equações (13.100) 
e (13.101), juntamente com os valores conhecidos de To(x), Tı (x), Uo(x) e U1 (x), nos dão — ou melhor, dão a 
um computador — um meio conveniente de obter o valor numérico de qualquer Ta (£o) ou Un (xo), sendo xo um 
número dado. 
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Tabela 13.4 Polinômios Tabela 13.4 Polinômios 
de Chebyshev, tipo I de Chebyshev, tipo H 
To=1 Uo = 1 
Tı =r Uı = 2y 
T = 2z? — 1 U> = 4x? — 1 
T = 4r? — 3x U; = 8x3 — 4r 
T, = 8z — 8r? + 1 U, = 167º — 12r? + 1 
T; = 162º — 20x? + 5x U; = 32x5 — 32x3 + 6x 
Te = 327º — 48x4 + 18x? — 1 Us = 644º — 80x4 + 24x? — 1 


-1 


Figura 13.6: Polinômios de Chebyshev U, (x). 


Mais uma vez, podemos obter pelas funções geradoras os valores especiais de vários polinômios: 


Ta(1)=1, Tine, 
Ton(0) = (—1)”, Tən+1(0) = 0; (13.102) 
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VilD)=n+1,  Un(-1) 


II 

| 
NS 
3 

z 
$ 
Z 


S (13.103) 
U2n(0) = (—1)º, U2n+1(0) = 0. 
Por exemplo, comparando a série de potências 
1-2 ltt É 
2 — tr tott 
Gen Ie A a) 
com a Equação (13.99), para x = 1, temos T,(1) e para z = —1, uma expansão similar de (1 — t) (1 + t) resulta 


em Ta(—1), ao passo que substituir t — —t? na primeira série de potências resulta em T, (0). A série de potências 
para (1 +t) 2e (1 +t2)"! gera as correspondentes Un (+1), Un (0). 

As relações de paridade para T, e Un resultam de suas funções geradoras com as substituições t > —t,x — 
—«, que as deixam invariantes; elas são 


Tilg)=(DI(-e),  U(g)=(IPU(-s). (13.104) 
As representações de Rodrigues de Ta (x) e Un(x) são 


pra — x?) d” 2 n—1/2 
OR e (13.105) 


= (—1)” (n+ Dm? d” 2n n+1/2 
= art (mn + DI — z?) 12 dar [( T ) |. 


Un (x) (13.106) 


Relações de Recorrência — Derivadas 
Diferenciação das funções geradoras para Tn (x) e Un (x) em relação à variável x leva a uma variedade de relações 
de recorrência que envolvem derivadas. Por exemplo, assim obtemos da Equação (13.99) 


(1-20t+0)23 T) (a)i = 2t | Tola) +25 Tila” |, 
n=1 


n=1 


da qual extraímos a recursão 
2Taa(a) = Tila) — 227 (0) + Ti o(a), (13.107) 


que é a derivada da Equação (13.100) para n — n — 1. Entre as recursões mais úteis que obtemos desse modo 
estão 

(1—2)Ti(a) = —naTi(x) + nTn- (£) (13.108) 

(1 — 2?) U} (x) = -nUn (x£) + (n + 1)Un-1 (x). (13.109) 


Manipulando várias dessas recursões, como fizemos na Seção 12.2 para polinômios de Legendre, podemos eliminar 
o índice n — 1 também em favor de T” e estabelecer que T, (x), o polinômio de Chebyshev tipo I, satisfaz a EDO 


(1 — 2?) T} (x) — £T) (x) + nºTa(a) = 0. (13.110) 
O polinômio de Chebyshev tipo II, U, (x), satisfaz 
(1-2)U/(x) — 32U/ (x) + n(n + BUn(a) = 0. (13.111) 


Polinômios de Chebyshev podem ser definidos partindo dessas EDOs, mas preferimos dar ênfase às funções 
geradoras. 
A equação ultra-esférica 


2 
(1— a?) ES 08 (a) — (2a + Dea) +n(n + 2a)C® (x) = 0 (13.112) 
é uma generalização dessas equações diferenciais, reduzindo-as à Equação (13.110), para «a = 0, eà 


Equação (13.111), para a = 1 (e à equação de Legendre para a = 5). 
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Forma Trigonométrica 
Neste ponto do desenvolvimento das propriedades das soluções de Chebyshev é interessante trocar variáveis, 
substituindo x por cos 9. Com x = cos 0 e d/dx = (—1/sen 0)(d/d0), verificamos que 


d2T, d2T, dT, dT, 
2 noo n n Haie n 
(1 x ) 2 AR cot O do” Tl, = Coto 5 


Somando esses termos, a Equação (13.110) se torna 


dTa 


I +n?Ta = 0, (13.113) 


a equação do oscilador harmônico simples com soluções cos n e sen n. Os valores especiais (condições de 
contorno em x = 0, 1) identificam 
Ta = cos nô = cosn(arccos x). (13.114a) 


Uma segunda solução linearmente independente das Equações (13.110) e (13.113) é rotulada 
Vn = sen nô = sen n(arccos z). (13.114b) 


As soluções correspondentes da equação de Chebyshev tipo II, Equação (13.111), se tornam 


10 
Ep Ene (13.115a) 
sen 9 
1) 
poa ERU (13.115b) 
sen 6 


Os dois conjuntos de soluções, tipo I e tipo II, são relacionados por 
Valz) = (1-0) Uta), (13.116) 
Wala) = (1— 22) Taa (2). (13.116b) 


Como já vimos pelas funções geradoras, T, (x) e Un(x) são polinômios. Claramente, Vp (x) e Wn (x) são não 
polinômios. Por 


Tala) + iVa (£) = cosnô + isen nô 
= (cos 0 + isen 0)” = [z +i(1-2)2]",  el<i (13.117) 


obtemos expansões 


Tu(x) = z” — ( > Jor — 2?) + ( A en -2 (13.118a) 


Valz) = æl 7 Je- ( k J-a) i (13.118b) 


| 
Ta) = pa (2g) am 13.11 
para n > 1, com [n/2] o maior inteiro abaixo de n/2 e 
[n/2] (nom) 
Un(e) = X (17 (22) =m, (13.119b) 
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Ortogonalidade 


Se a Equação (13.110) for colocada em forma auto-adjunta (Seção 10.1), obtemos w(x) = (1 — x?) 1/2 como 


um fator de peso. O fator de peso correspondente para a Equação (13.111) é (1 — 


x?) +12, As integrais de 


ortogonalidade resultantes, 


i 0, mn, 
/ Tm(£)Ta (£) (1 — z?) dz > m=n#0, (13.120) 
zE T, m = =U, 
y 0, mn, 
/ Vin(2)Va(a)(1— 22) “2 da = A m=n +0, (13.121) 
aa 0, m=n= 0, 
£ 
/ Um (2)Un(2)(1 — 22) "2 da = mn, (13.122) 
=) 
1 
Wm (2£)Wn (£) (1 — 22) da = Smam (13.123) 


são uma consegiiência direta da teoria de Sturm-Liouville, Capítulo 10. O melhor modo de obter os valores de 
normalização é usar x = cos 0 e converter essas quatro integrais em integrais de normalização de Fourier (para o 
intervalo de meio-período [0, 7]). 


Exercícios 


13.3.1 


13.3.2 


13.3.3 


13.3.4 


13.3.5 
13.3.6 


13.3.7 


Uma outra função geradora de Chebyshev é 


1— zt Z 
Na tai 
1— dat + É > (2) ij 


Como X, (x) está relacionada a Ta (x) e Un(x)? 
Dado 
(1 — x°) UR (£) — 32U/ (x) + n(n + 2)Un (£) = 0, 


mostre que Vp (x) (Equação (13.116a)) satisfaz 
(1 — x°) V; (£) — £V} (x£) + n? Va (£) = 0, 


que é a equação de Chebyshev. 
Mostre que o wronskiano de T, (x£) e Vn (x) é dado por 


n 


Tale) V; EEA 


n 


(x) — Ty (2) Vala) = — 


Isso verifica que Tn e Va(n # 0) são soluções independentes da Equação (13.110). Ao contrário, 
para n = 0, não temos independência linear. O que acontece em n = 0? Onde está a “segunda” 
solução? 


Mostre que W, (x) = (1 — 42) 1/27, 12º) é uma solução de 


(1-2) Wi (x) — 32W; (x) + n(n + 2)Wn (£) = 0. 


Avalie o wronskiano de U, (x) e Wp (£) = (1 — 22)-1/2T (a). 

Vala) = (1 — «42)!2U, (x) não é definida para n = 0. Mostre que uma segunda solução, 
independente, da equação diferencial de Chebyshev para T (x) (n = 0) é Vo(x) = arccos x (ou 
arcsen x). 


Mostre que Va(x) satisfaz a mesma relação de recorrência de três termos que Ta(x) 
(Equação (13.100)). 


648 
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13.3.8 
13.3.9 


13.3.10 


13.3.11 


13.3.12 


13.3.13 


13.3.14 


13.3.15 


13.3.16 


Verifique as soluções de série para Tn (x) e Un (x) (Equações (13.109a) e (13.119b)). 
Transforme a forma de série de Ta (x) em uma série de potências ascendente. 


Resposta: Ton(2) = (—1)”n 5 (-D” e 
m=0 l l 

_2n+1 h (P(n +m)! a 2m4 

Toən+1(£) = D DR os a + 


(2x), n>], 


Reescreva a forma de série de U„ (x), Equação (13.119b), como uma série de potências ascendente. 
Resposta: Uzn (£) = (—1)” X- (-1) a (2), 


m=0 
n 


Uza (2) = ("5 CD” 


m=0 


n 


(n +m+ 1)! 
(n — m)!(2m + 1)! 


(jo 


Derive a representação de Rodrigues de Ta (a), 


-9” 1/2 l-z? 1/2 d” = 
ng dp 
ar (ms! da 
Sugestão: Uma possibilidade é usar a relação de função hipergeométrica 


2Fı (a,b; c; z) = (1—2) 4 5h (a c= bye; +). 
= 2 


com z = (1—«)/2. Uma abordagem alternativa é desenvolver uma equação diferencial de primeira 
ordem para y = (1— Ed Ng 2, Diferenciação repetida dessa equação leva à equação de Chebyshev. 


(a) Pela equação diferencial para T, (em forma auto-adjunta), mostre que 


1 
/ ATm(x) dTn(x) (1 z?) 1e dz = 0, MEN. 
—ı dr da 


(b) Confirme o resultado precedente mostrando que 


A expansão de uma potência de x em uma série de Chebyshev leva à integral 


1 
da 
Lan 1" Talx) >. 
e ( A — q? 


(a) Mostre que essa integral se anula para m < n. 
(b) Mostre que essa integral se anula para m + n ímpar. 
Avalie a integral A 
= ja dx 
Tan = L £ TD e ; 

para m > n e m +n par, por cada um dos dois métodos: 
(a) Trabalhe com x como a variável, substituindo T, por sua respectiva representação de Rodrigues. 
(b) Usando x = cos 0, transforme a integral para uma forma com é como a variável. 

m! (m-n-1)! 
(m-n)! (m+n)! 
Estabeleça os seguintes limites, —1 < x < 1: 


Resposta: Imn = 7 ; mn, m +n par. 


< n2. 


d 
A Sn ib) Eno 


(a) Estabeleça o seguinte limite, —1 < x < 1: |Vp (x)| < 1. 
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13.3.17 


13.3.18 


13.3.19 


13.3.20 


13.3.21 


13.3.22 


13.3.23 


13.3.24 


13.3.25 


13.3.26 


13.3.27 


(b) Mostre que W, (x) não é limitado em —1 < z < 1. 
Verifique as integrais de ortogonalidade-normalização para 


(a) Tm (£), Ta (£), (b) Vin(x), Vala), 
(c) Lado); Ult); (d) Wm(x), Wan (z). 


Sugestão: Todas essas expressões podem ser convertidas para integrais de Fourier de 
ortogonalidade-normalização. 


Mostre se 
(a) Tm(£) e Va(x) são ou não são ortogonais no intervalo [—1,1] em relação ao fator de peso 
(1 — z2)71/2 


Derive 
(a) Tasi(x) + Tn-1 (£) = 24Ta(x), 
(b) Tntn(i) +Tm-n(£) = 2Tm(0)Tala), 
pelas identidades de co-seno “correspondentes”. 
Várias equações relacionam os dois tipos de polinômios de Chebyshev. Como exemplos, mostre 
que 
Tala) = Un(x) — Un- (£x) 


(1—2)Un(x) = £Tn41 (£) — Tnh42(2). 


Mostre que 
dVala) Tala) 


dx Es 4/1 — z2 
(a) usando as formas trigonométricas de V, e Tn, 
(b) usando a representação de Rodrigues. 


Começando com z = cos 0 e Ta(cos 0) = cos n0, expanda 


i0 —ið N É 
Aa (: +e ) 
2 


= ma e+ (1 ) Tento) + (À Jia, 


a série entre colchetes que termina com ( jm (x), para k = 2m + 1 ou i( )To para k = 2m. 


e mostre que 


k k 

(a) Calcule e tabule as funções de Chebyshev Vi (x), V2(x) e Vz(x), para x = —1,0(0,1)1,0. 

(b) Uma segunda solução da equação diferencial de Chebyshev, Equação (13.100), para n = 0, é 
y(x) = sen” tz. Tabule e trace essa função na mesma faixa: —1, 0(0, 1)1, 0. 


Escreva um programa de computador para gerar os coeficientes as na forma polinomial do 
polinômio de Chebyshev Ty (x) = J gasus. 

Tabule Tio(x:) para 0,00(0,01)1,00. Isso incluirá as cinco raízes positivas de Tio. Se dispuser de um 
software gráfico, monte um gráfico com seus resultados. 


Determine as cinco raízes positivas de T10(1:) chamando uma sub-rotina de procura de raízes. Use 
o que sabe sobre a localização aproximada dessas raízes pelo Exercício 13.3.25 ou escreva uma 
rotina de busca para procurar as raízes. Essas cinco raízes positivas (e suas negativas) são os pontos 
de avaliação do método da quadratura de 10 pontos de Gauss-Chebyshev. 


Valores de verificação. x; = cos [(2k — 1)7/20], k=1,2,3,4,5. 


Desenvolva as seguintes expansões de Chebyshev (para [—1, 1]): 
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@ (=)= ah -25 (48º 1)" ido). 
s=1 


+, 0<gz<l 4. ; E 
E iÍ | DOD C+D enla) 
g s=0 


13.3.28 (a) Mostre que, para o intervalo [—1, 1] 


(b) 


oO 


1 (2s — 3)! 
= jet 4s + DP», 
|z] a, ) (25 5316 s + DPos(x) 
2 4 1 
= fjet Tos (£). 
m'r ) 482 —1 ° (x) 


(b) Mostre que a razão entre o coeficiente de To. (x) e o de Pos (x) se aproxima de (75)! quando 
s — 00. Isso ilustra a convergência relativamente rápida da série de Chebyshev. 

Sugestão: Usando as relações de recorrência de Legendre, reescreva x: P, (x) como uma combinação 

linear de derivadas. A substituição trigonométrica x = cos 0, Ta(x) = cos n0 é muito útil para a 

parte de Chebyshev. 


13.3.29 Mostre que 
2 


T 2 —2 
E Ns) 


Sugestão: Aplique a identidade de Parseval (ou a relação de completude) aos resultados do Exercício 
13.3.28. 


13.3.30 Mostre que 


OO 


1 T 4 1 
(a) cos x = Sig a En + pz Pena (a). 
z da 1 
(b) sen lr = = y. Gn + 17 ela). 
n=0 


13.4 Funções Hipergeométricas 


No Capítulo 9, a equação hipergeométrica!? 


| x(1 — x)y” (x) + [c— (a+b+ De]y'(x) — ab y(x) = 0 (13.124) 


foi introduzida como uma forma canônica de uma EDO linear de segunda ordem com singularidades regulares em 
x = 0,1 e co. Uma solução é 


y(x) = 2Fi(a,b;c;a) 
aba aļ(a+1)b(b+ 1) zx? 


= 1 e... 
ii Ta c(c+ 1) 2! , 


c£O,-1,-2,-3,..., 
(13.125) 


que é conhecida como função hipergeométrica ou série hipergeométrica. O intervalo de convergência para 
c>a+bélz|<1,ezx=1leéar=-l para, c > a+ b-— 1. Em termos do símbolo de Pochhammer, usado com 
frequência, 
(a+n— 1)! 

(a- DD)! 
(a)o = 1, (13.126) 


(a)n = a(a+D(a+2)--(a-n—D)= 


a função hipergeométrica se torna 


aFi(a bia) => mdt, (13.127) 
n=0 n 4 


10 Às vezes ela é denominada EDO de Gauss. Então, as soluções se tornam funções de Gauss. 
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Nessa forma, os índices inferiores 2 e 1 se tornam claros. O índice inferior principal 2 indica que aparecem 
dois símbolos de Pochhammer no numerador e o índice inferior final 1 indica um símbolo de Pochhammer no 
denominador.!! (A função hipergeométrica confluente 4 F} com um símbolo de Pochhammer no numerador e um 
no denominador aparece na Seção 13.5.) 

Pela forma da Equação (13.125), vemos que o parâmetro c pode não ser zero ou um inteiro negativo. Por 
outro lado, se a ou b for igual a O ou um inteiro negativo, a série termina e a função hipergeométrica se torna 
um polinômio. Muitas outras dessas funções elementares podem ser representadas pela função hipergeométrica.!? 
Comparando a série de potências, verificamos que 


ln(1 +x) = z F1 (1,1; 2; =x). (13.128) 


Para as integrais elípticas completas K e E, 


e - m 11 

K(k?) -f (1 — k?sen?0) “ao = Soma), (13.129) 
me 1/2 T 1 1 

E(k?) S (1 — k?sen 0) “do = 5 (pgn) (13.130) 
(0) 


As formas de série explícitas e outras propriedades das integrais elípticas são desenvolvidas na Seção 5.8. 
A equação hipergeométrica como um EDO linear de segunda ordem tem uma segunda solução independente. 
A forma usual é 
ylz) =£ Fi(a+1-c,b+1- c2- c zr), c£2B4,... (13.131) 


Se c for inteiro, as duas soluções coincidem ou (exceto se houver uma salvação por a inteiro ou b inteiro) uma 
das soluções aumentará demais (veja o Exercício 13.4.1). Nesse caso, espera-se que a segunda solução inclua um 
termo logarítmico. 

Entre as formas alternativas da EDO hipergeométrica estão 


(1 a a) [(a+b+1)z—-(a+b+1 2 ia) 


-aby =) =0, (13.132) 
2 
2 p= 
(1 2) Lue) [eate aa Lyle) 4ab y(2°) =0. (13.133) 


Relações de Funções Contíguas 

Os parâmetros a, b e c entram da mesma maneira que o parâmetro n das funções de Bessel, Legendre e de outras 
funções especiais. Do mesmo modo que constatamos com essas funções, esperamos relações de recorrência que 
envolvem mudança unitárias nos parâmetros a, b e c. A nomenclatura usual para as funções hipergeométricas, nas 
quais um parâmetro muda de + ou —1, é uma “função contígua”. Generalizando esse termo para incluir mudanças 
unitárias simultâneas em mais de um parâmetro, encontramos 26 funções contíguas a sFi(a, b; c; x). Considerando- 
as duas por vez, podemos desenvolver um formidável total de 325 equações entre as funções contíguas. Um 
exemplo típico é 


(a-b)fc(a+b-D)+1-0º-?+[(a-b)? -1](1-2)boFi(a,b;c;x) 
= (c— a)(a— b+ 1)b2Fı(a — 1,b + 1; c; x) 
+ (c— b)(a— b — 1)a 2Fı(a + 1,b— 1; c; x). (13.134) 


Uma outra relação de função contígua aparece no Exercício 13.4.10. 


HO símbolo de Pochhammer costuma ser útil em outras expressões que envolvem fatoriais, por exemplo, 


A-2"=5(ane/nl, lad<l 


n=0 


2Com esses parâmetros, a, b e c, podemos representar praticamente qualquer coisa. 
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Representações Hipergeométricas 

Uma vez que a equação ultra-esférica (13.112) na Seção 13.3 é um caso especial da Equação (13.124), vemos que as 
funções ultra-esféricas (e funções de Legendre e Chebyshev) podem ser expressas como funções hipergeométricas. 
Para a função ultra-esférica, obtemos 


! 1- 
en( n,n+28+1;1+6: =o (13.135) 


comparando sua EDO com a Equação (13.124) e as soluções de séries de potências. Para funções de Legendre e 
associadas de Legendre, encontramos, de modo semelhante, 


1= 
P (£) = 2F1 (n+ Eie z), (13.136) 
1 — z?)™/?2 1— 
P”(x) = aa a m-n,m+n+1;m+1; E). (13.137) 
(n-m)! m! 2 


Formas alternativas são: 


A n (2n)! 11 3 
Pən(x£) = (—1) nnn 2Fi| -n,n + zT 
2n— 1)! 11 
=( 1º ot ai( nn+oigio?), (13.138) 
n(2n + 1)! 33 
Poni(x) = (—1) ut ari( n;n + z’ pa) 
2n + D! 33 
=( 1º e ani( mnt Ziga a (13.139) 


Em termos de funções hipergeométricas, as funções de Chebyshev se tornam 


11- 
Tals) = Fi ( -n,n; 5; =E), (13.140) 
2? 2 
3 l-r 
Un(x) = (n+ 1) 2F4 (n+ 25; =) (13.141) 
J= 
Vala) = ny1- 22 m (- n+Ln+]1; 5, ==) (13.142) 


Os fatores principais são determinados por comparação direta de séries de potências completas, comparação de 
coeficientes de potências particulares da variável ou avaliação em x = 0 ou 1, e assim por diante. 

A série hipergeométrica pode ser usada para definir funções com índices não-inteiros. As aplicações físicas são 
mínimas. 


Exercícios 
13.4.1 (a) Para c, inteiro, e a e b não-inteiros, mostre que 


2F; (a, b; c; x) e r° o Fila+1-c,b+1- c2- cr) 


apresentam como resultado só uma solução para a equação hipergeométrica. 
(b) O que acontece se a for um inteiro, digamos, a = —1 e c = —2? 
13.4.2 Ache as relações de recorrência de Legendre, Chebyshev I e Chebyshev II correspondentes à função 
hipergeométrica contígua, Equação (13.134). 
13.4.3 Transforme os seguintes polinômios em funções hipergeométricas de argumento x2. (a) Ton (£); 
(b) 27! Tons (x); (c) Un (z); (d) 27! U2n+1 (7). 
Resposta: (a) Tanta )=(—1)" ; 
(b) £~ !Tony1 (£) = A 2Fi(=n,n + 1; 5:02). 
(c) Uan(a ) = (1) 2Fı(— n,n + 1; $;x?). 
(d) tUr (£) = (—D)"(2n + 2) 2Fi (=n, n + 2; 3; x2). 
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13.4.4 
13.4.5 


13.4.6 


13.4.7 


13.4.8 


13.4.9 


13.4.10 


Derive ou verifique o fator principal nas representações hipergeométricas das funções de Chebyshev. 


Verifique que a função de Legendre da segunda espécie, Q, (z), é dada por 


nt/2) v lv Vv 3 
ne F 1; E 
Q(z) (v + PA ? (4+5 2 to? de 
ja >1, largz|<7, v Æ —1,—2,—3,.... 


Por analogia com a função gama incompleta, podemos definir uma função beta incompleta por 


Ba(a,b) = [ (dr 
0 


Mostre que 
Bz(a,b) = 02º aFi(a,1—b;a-+ 1; £). 


Verifique a representação integral 


P(c) i b—1 c—b—1 —a 
rare | * (=) toe de 


Quais restrições devem ser impostas aos parâmetros be c e à variável z? 

Nota: A restrição sobre |z| pode ser descartada, continuação-analítica. Para a não-inteiro, o eixo 
real no plano z de a co é uma linha de corte. 

Sugestão: A integral tem uma semelhança com uma função beta e pode ser expandida em uma série 
de funções beta. 


aFi(a,b;c;2) = 


Resposta: R(c) > R(b) > 0, e |z| < 1. 


Prove que 


r(e) (c— a -— b) 


aFi(a,b;c;1) = Te- aTe — b)’ 


cÆ 0,—1,—2,... c>a+b. 
Sugestão: Esta é uma chance de usar a representação integral, Exercício 13.4.7. 


Prove que 


Sugestão: Experimente uma representação integral. 
Nota: Essa relação é útil no desenvolvimento de uma representação de Rodrigues de T, (x) 
(compare com o Exercício 13.3.11). 


Verifique que 


2Fı(—n, b; c; 1) = 


Sugestão: Esta é uma chance de usar a relação de função contígua [2a — c + (b — a)zx] - 
2Fı (a,b; c; x) = a(1 — x) 2Fı (a + 1, b; c; x) — (c — a)aFi(a — 1,b;c; x) e indução matemática. 
Como alternativa, use a representação integral e a função beta. 


13.5 Funções Hipergeométricas Confluentes 
A equação hipergeométrica confluente!? 


ay" (a) + (c— v)y (x) — ay(x) = 0 (13.143) 


BEssa expressão costuma ser denominada equação de Kummer. Então, as soluções são funções de Kummer. 


“livro” — 2007/8/1 — 15:06 — page 654 — #664 


654 Física Matemática Arfken e Weber ELSEVIER 


tem uma singularidade regular em x = 0 e uma irregular em x = oo. Ela é obtida da equação hipergeométrica da 
Seção 13.4 por fusão (disponível: «(1 — x) — x na Equação (13.124)) de duas de suas três singularidades. Uma 
solução da equação hipergeométrica confluente é 


ylz) =1Fi(a;c;x) = M (a, c, x) 
ax aļla+1)z? 


=1 
T c(c+1) 2! 


c£0,-1,-2,... (13.144) 


Essa solução é convergente para todo « finito (ou z complexo). Em termos do símbolo de Pochhammer, temos 


M(a,c,2) =>, (alear. (13.145) 


Claramente, M (a,c, x) se torna um polinômio se o parâmetro a é O ou um inteiro negativo. Numerosas outras 
funções mais ou menos elementares podem ser representadas pela função hipergeométrica confluente. Como 
exemplos citamos a função erro e a função gama incompleta (pela Equação (8.69)): 


2 [Ea 2 Ns 
ata) = -ia | e i= -M3s x j (13.146) 
yla, x£) = 7i e™*t! dt = a™ tz" M (a,a + 1, — z), R(a) > 0. (13.147) 
0 


É óbvio que isso coincide com a primeira solução para c = a. A função erro e a função gama incompleta são 
discutidas na Seção 8.5. 
Uma segunda solução da Equação (13.143) é dada por 


ylz) = 2!"*M(a+1-=€,2- c, x), c£2B4,... (13.148) 


A forma padrão da segunda solução da Equação (13.143) é uma combinação linear das Equações (13.144) e 
(13.148): 


U(a,c, £) = (13.149) 


T M (a,c, £) x1 M(a+1-—c,2-— c, T) 
sen TC 


(a — c)!(c— 1)! (a— DI(1—c)! 
Note a semelhança com nossa definição da função de Neumann, Equação (11.60). Assim como aconteceu com a 
nossa função de Neumann, Equação (11.60), essa definição de U (a, c, x) se torna indeterminada nesse caso para c 
inteiro. 
Uma forma alternativa de equação hipergeométrica confluente que será útil mais tarde é obtida mudando a 
variável independente de x para z?: 
d? 2 2c- 1 
qo vv") | 


d 2 y 
22! ge ) 4ay(a ) = 0. (13.150) 


Como acontece com funções hipergeométricas, existem funções contíguas nas quais os parâmetros a e c são 
alterados por +1. Incluindo os casos de alterações simultâneas nos dois parâmetros, !* temos oito possibilidades. 
Considerando a função original e pares de funções contíguas, podemos desenvolver um total de 28 equações.!º 


Representações Integrais 


Muitas vezes é conveniente ter as funções hipergeométricas confluentes na forma integral. Encontramos 
(Exercício 13.5.10) 


1 
M(a,c,x) = raros | ep old, R(c) > R(a) > 0, 
Elite ao (13.151) 
U(a,c,x) = Ea e EP +E! dt, R(x) > 0, R(a) > 0. 
F(a) Jo (13.152) 


Três importantes técnicas para derivar ou verificar representações integrais são as seguintes: 


14 Slater se refere a elas como funções associadas. 
!5 As relações de recorrência para funções de Bessel, Hermite e Laguerre são casos especiais dessas equações. 
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1. Transformação de expansões de função geradora e representações de Rodrigues: as funções de Bessel e 
Legendre fornecem exemplos dessa abordagem. 

2. Integração direta para obter uma série: essa técnica direta é útil para uma representação de função de Bessel 
(Exercício 11.1.18) e de uma integral hipergeométrica (Exercício 13.4.7). 

3. (a) Verificação de que a representação integral satisfaz a EDO. (b) Exclusão da outra solução. (c) Verificação 
de normalização. Esse é o método usado na Seção 11.5 para estabelecer uma representação integral da função 
modificada de Bessel K, (z). Aqui, ele funcionará para estabelecer as Equações (13.151) e (13.152). 


Funções de Bessel e Funções Modificadas de Bessel 


A primeira fórmula de Kummer, 
M(a,c, £) = e” M(c— a,c, =£), (13.153) 


é útil para representar as funções de Bessel e modificadas de Bessel. A fórmula pode ser verificada por expansão 
de série ou por utilização de uma representação integral (compare com o Exercício 13.5.10). 

Como se esperava da forma da equação hipergeométrica confluente e do caráter de suas singularidades, as 
funções hipergeométricas confluentes são úteis para representar inúmeras funções especiais da Física Matemática. 
Para as funções de Bessel, 


“ix v 1 
Ja = (E) M[v+ 2, w +1,22), (13.154) 
v! \2 2 
enquanto para as funções modificadas de Bessel da primeira espécie, 
e? fxr” 1 


Funções de Hermite 
As funções de Hermite são dadas por 


2n)! 1 
Hon(x) = ( 1)" Cu) u( mg) (13.156) 
Hmyı(2)=( y u( mza) (13.157) 


usando a Equação (13.150). 
Comparando a EDO de Laguerre com a equação hipergeométrica confluente (13.143), temos a 
Equação (13.143), 
Lal) = M(—n,1, x). (13.158) 


A constante é fixada como unidade, notando a Equação (13.66) para x = 0. Para as funções associadas de Laguerre, 


qe (n+m)! 


L? (x)= (Dam Enn (e) = M(-n;m+1,a). (13.159) 


nim! 

Obtém-se uma verificação alternativa comparando a Equação (13.159) com a solução de série de potências 
(Equação (13.72) da Seção 13.2). Observe que, na forma hipergeométrica, diferente da representação de Rodrigues, 
os índices n e m não precisam ser inteiros e, se não são inteiros, L? (x) não será um polinômio. 


Casos Diversos 
Há certas vantagens em expressar nossas funções especiais em termos de funções hipergeométricas e 
hipergeométricas confluentes. Se o comportamento geral dessas últimas funções for conhecido, o comportamento 
das funções especiais que investigamos resulta em uma série de casos especiais. Isso pode ser útil para determinar 
o comportamento assintótico ou avaliar integrais de normalização. O comportamento assintótico de M (a, c, x) e 
U(a,c,a) pode ser convenientemente obtido pelas representações integrais dessas funções, Equações (13.151) e 
(13.152). Uma outra vantagem é que as relações entre as funções especiais são esclarecidas. Por exemplo, um 
exame das Equações (13.156), (13.157) e (13.159) sugere que as funções de Laguerre e Hermite são relacionadas. 
Está claro que a equação hipergeométrica confluente (13.143) não é auto-adjunta. Por essa e outras razões, é 
conveniente definir 


1 
Mku(x) = etlam (= k+ puto), (13.160) 
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Essa nova função, My,(x), é uma função de Whittaker que satisfaz a equação auto-adjunta 


1 


l k 2 
Myglx) + ( A 4 — ato =0. (13.161) 


A segunda solução correspondente é 


1 
Weulx) = emela] y + su + ie). (13.162) 


Exercícios 


13.5.1 


13.5.2 


13.5.3 


13.5.4 


13.5.5 


13.5.6 


13.5.7 


13.5.8 


Verifique a representação hipergeométrica confluente da função erro 


2x 13 
erf(x) = TMa 2 ="), 


Mostre que as integrais de Fresnel C(x) e S(x) do Exercício 5.10.2 podem ser expressas em termos 
da função hipergeométrica confluente como 


1 3 inz? 
Ole) +ista) = oM ( 3,5, TE) 
Por diferenciação direta e substituição verifique que 


x 
y= are] e~t! dt = ax y(a,x) 
0 


satisfaz 
ay" +(a+1+a)y +ay=0. 


Mostre que a função modificada de Bessel da segunda espécie, K, (x), é dada por 
1/2,—a v 1 
K(x) =m e” (2x) U | v + z2r + 1,24 a 


Mostre que as integrais de co-seno e seno da Seção 8.5 podem ser expressas em termos de funções 
hipergeométricas confluentes como 


Ci(x) + isi(x) = —eU(L, 1,-ix). 


Essa relação é útil no cálculo numérico de Ci(x) e si(x:) para valores grandes de x. 


Verifique a forma hipergeométrica confluente do polinômio de Hermite, Honsi(x) 
(Equação (13.157)), mostrando que 


(a) Hən+1ı(x)/x satisfaz a equação hipergeométrica confluente com a = —n,c = 5 e argumento 
ZA; 

2(2n +1)! 
n! i 


. Honşi() 7 
(b) lim E = (—1) 
Mostre que a equação da função hipergeométrica confluente contígua 
(c—a)M(a—1,c,x)+ (2a — c+ x)M(a,c,£)—aM(a+1,c, x)= 0 


leva à relação de recorrência da função associada de Laguerre (Equação (13.75)). 
Verifique as transformações de Kummer: 


(a) M(a,c, £) = e M (c -— a,c, —x) 
(b) U(a,c, £) = £t™U (a — c +1,2 -— c, x). 


ELSEVIER 
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13.5.9 


13.5.10 


13.5.11 


13.5.12 


13.5.13 


13.5.14 


13.5.15 


13.5.16 


Prove que 
(a) E ui CT) = tada b+n, x) 
dz” 1 a (b)n b) , , 


(b) L iat x) = (—1)” (a)nU la +n,c +n, x). 


dx” 
Verifique as seguintes representações integrais: 
P(c) ! tya—1 —a-1 
M(a,c,x) = > —— pda) Cla, R(c) > R(a) > 0. 
@ Maca) = Torço) CTA) (©) > R(a) 


(b) U (a,c, £) = ro J ER E dr R(x) >0, R(a) > 0. 
0 


Sob quais condições você pode aceitar R(x) = 0 na parte (b)? 


Pela representação integral de M (a, c, x), Exercício 13.5.10(a), mostre que 
M(a,c, x£) = e M(c-— a,c, =z). 


Sugestão: Substitua a variável de integração t por 1 — s para liberar o fator e” da integral. 
Pela representação integral de U (a, c, x), Exercício 13.5.10(b), mostre que a integral exponencial é 
dada por 

E(x) =e "U(1,1, x). 


Sugestão: Substitua a variável de integração t em E; (x) por z(1 + s). 


Pelas representações integrais de M(a,c,x) e U(a,c,x), no Exercício 13.5.10, desenvolva 
expansões assintóticas de 

(a) M(a,c, x), (b) U (a,c, £). 

Sugestão: Você pode usar a técnica que foi empregada com K, (2), Seção 11.6. 


Resposta: (a) o L fı + (a ole å) + 
A-a(2-a)(c-a)(c-a+1) 
2!x2 E } 
1 a(l+a-c) ala+1)(1+a-0o)(2+a-c) 
(b) {i+ a | TEE i e) 


Mostre que o wronskiano, das duas funções hipergeométricas confluentes M (a, c, x) e U (a, c, £) é 
dado por 
(c— 1)! e” 


(a— Dae 


MU'- M'U = — 


O que acontece se a for O ou um inteiro negativo? 


A equação de onda de Coulomb (parte radial da equação de Schrödinger com potencial de Coulomb) 
é 

2n) L(L+1) 
2 


dy 
+ |1 
dp? p p 
Mostre que uma solução regular y = Fr (n, p) é dada por 


y=0. 


Fr (n, p) = Cr(n)p™ tte ™®M(L +1 — in, 2L + 2, 2ip). 


(a) Mostre que a parte radial da função de onda do hidrogênio, Equação (13.81), pode ser escrita 
como 


e Po LET! (or) 
(n+ L)! 


= =ar/2 lar) M(L +1 — n, 2L +2, ar). 
m- DCL? (ar) M(L+1-—n,2L+2,ar) 
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(b) Admitimos anteriormente que a energia total E (cinética + potencial) do elétron era negativa. 
Reescreva a função de onda radial (não-normalizada) para o elétron livre, E > 0. 

Resposta: e'"/2(ar)LM(L+1 — in, 2L+2, —iar), onda emergente. 

Essa representação fornece uma poderosa técnica alternativa 

para o cálculo de coeficientes de foto ionização e 


recombinação. 
13.5.17 Avalie 
oo 2 oo a dx 
(a) J Melo) de, ©) / [Magda] E, 
0 0 


So d 
of Mo E 
0 D 
1 


em que 2u = 0,1,2,...,k — u — 3 = 0,1,2,...,a > —2u — 1. 
Resposta: (a) (241)!2k:. (b) (24)! (c) (2u)!(2h)º. 


13.6 Funções de Mathieu 


Quando EDPs como as de Laplace e Poisson e a da equação de onda são resolvidas com condições de contorno 
cilíndricas ou esféricas para separar variáveis em coordenadas polares, encontramos soluções radiais, que são as 
funções de Bessel do Capítulo 11, e soluções angulares, que são sen my, cos my em casos cilíndricos e harmônicos 
esféricos em casos esféricos. São exemplos as ondas eletromagnéticas em cavidades ressonantes, cabeçotes de 
cilindros circulares vibratórios e guias de onda coaxiais. 

Quando a condição de contorno circular se torna elíptica nesses problemas cilíndricos, somos levados às funções 
de Mathieu angular e radial, que, portanto, podem ser denominadas funções cilíndricas elípticas. Na verdade, em 
1868, Mathieu desenvolveu os termos principais de soluções de série do cabeçote de cilindro elíptico vibratório e, 
no início da década de 1900, Whittaker e outros também derivaram termos de ordem mais alta. 

Aqui, nosso objetivo é dar uma introdução às ricas e complexas propriedades das funções de Mathieu. 


Separação de Variáveis em Coordenadas Elípticas 
Coordenadas cilíndricas elípticas £, n, z, que são adequadas para condições de contorno elípticas, são expressas 
em coordenadas retangulares como 


x = ccosh £ cos n, y = csenh sen n, EA (13.163) 
0O<é<o,  0O<n<2m, 


em que o parâmetro 2c > 0 é a distância entre os focos das elipses confocais descritas por essas coordenadas 
(Figura 13.7). Queremos mostrar que no limite c — 0 os focos das elipses se aglutinam como o centro de círculos. 
Trabalhamos principalmente com coordenada z constante, digamos, z = 0. De fato, para a variável radial fixa é = 
constante podemos eliminar a variável angular ņ para obter, pela Equação (13.163), 


r2 y? 


+ 
2 2 
c? cosh é  cêsenh £ 
que descreve elipses confocais centradas na origem do plano x,y com semi-eixos maiores e menores 


a = ccoshé, b = csenh é, (13.165) 


a N E Be (13.166) 
— = =: = e , A 
a E cosh? € 


a excentricidade e = 1/ cosh £ da elipse com O < e < 1, e a distância entre os focos 2ae = 2c dá uma interpretação 
geométrica da coordenada radial é e do parâmetro c. À medida que £ — 00, e — 0 e as elipses se tornam círculos, 
o que é indicado na Figura 13.7. À medida que é — 0, a elipse se torna mais alongada, até que, em é = 0, ela se 
reduz ao segmento de reta entre os focos. 

Quando 1 = constante, eliminamos é para encontrar hipérboles confocais 


=1, (13.164) 


respectivamente. Uma vez que 


r2 y? 


c? cos? — c2sen? n 


=1, (13.167) 
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y = 37/2 


Figura 13.7: Coordenadas elípticas £, n. 


que também estão representadas na Figura 13.7. Diferenciando a elipse, obtemos 


a da y dy 
zz + 2 
cosh é | senhºé 


=; (13.168) 


o que significa que o vetor tangente (dx, dy) da elipse é perpendicular ao vetor ( 4). A condição de 


cosh? £? senh’ 
ortogonalidade para a hipérbole é 
d d 
F = -I A =0, (13.169) 
cos? n  sen?n 


portanto, o produto escalar dos vetores tangenciais da elipse e da hipérbole em cada um de seus pontos de 
intersecção (x, y) da Equação (13.163) obedece a 
2 2 


T y 2 2 
=c'—c"=0. 13.170 
cosh2£cos2m — senh2ésen2m ) 


Isso significa que as elipses e hipérboles confocais formam um sistema de coordenadas ortogonais no sentido da 
Seção 2.1. Para extrair os fatores de escala hs, hy das diferenciais das coordenadas elípticas 


dx = csenhé cos n dé — c cosh Esen n dn, 


dy = ccosh Esen m dé + csenh £ cos n dn, LDO 
somamos seus quadrados, encontrando 
dx? + dy? = e? (sen h2€ cos? n + cosh? Esen?n) (de? + dn?) 
= œ (cosh? € — cos? n) (dé? + dn?) = h? dê” + h? dn? (13.172) 
e dando como resultado 
he = hy = c(cosh? € — cos? n). (13.173) 


Note que não há nenhum termo cruzado envolvendo dé dn, o que mostra mais uma vez que estamos tratando com 
coordenadas ortogonais. 
Agora estamos prontos para derivar equações diferenciais de Mathieu. 


Exemplo 13.6.1 | Tamsor Erírrico 


Consideramos vibrações de um cabeçote de tambor elíptico com deslocamento vertical z = z(x, y, t) governado 


pela equação de onda 
z SR 187z 
T T = pe’ (13.174) 
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em que a velocidade ao quadrado v? = T'/p com tensão T e densidade de massa p é uma constante. Primeiro, 
separamos a dependência de tempo do harmônico escrevendo 


2(2,9,t) = u(x, y)w(t), (13.175) 


em que w(t) = cos(wt + ô), sendo w a fregiiência e ô uma fase constante. Substituindo essa função z na 

Equação (13.174), temos como resultado 

1/82u E DEN 1 w w? 
ðr? Oy) vw O v2 


k? = constante, (13.176) 


u 


isto é, a equação bidimensional de Helmholtz para o deslocamento u. Agora usamos a Equação (2.22) para 
converter o laplaciano V? para as coordenadas elípticas, onde descartamos a coordenada z. Isso resulta em 


An alt 8) +ku=0, (13.177) 
isto é, a equação de Helmholtz em coordenadas elípticas £, n 

i + a + ck? (cosh? € — cos? m)u = 0. (13.178) 
Por último, separamos £ e ņ, escrevendo u(é,n) = R(£)® (n), o que resulta em 
1 d’ 
O dn? 


1 d2R 
R de + ck? cosh? E = c? k? cos? n 


1 
=A+ SOR, (13.179) 


em que À + k2/2 é a constante de separação. Escrevendo cosh2é,cos2m em vez de cosh2E, 
cos? m (o que motiva a forma especial da constante separação na Equação (13.179)), encontramos a EDO linear de 
segunda ordem 


d2R Paos 
Je (À — 2qcosh 2£)R(€)=0, — qg= ck, (13.180) 
que também é denominada equação radial de Mathieu, e 
d’ P 
dE (À — 2q cos 2n)® (n) = 0, (13.181) 


a equação angular ou modificada, de Mathieu. Note que o autovalor A(q) é uma função do parâmetro contínuo q 
nas EDOs de Mathieu. E essa dependência de parâmetro que complica a análise de funções de Mathieu e as coloca 
entre as mais difíceis funções especiais usadas em Física. E 


2 


Claramente, todos os pontos finitos são pontos regulares de ambas as EDOs, enquanto infinito é uma 
singularidade essencial para ambas as EDOs, que são do tipo de Sturm-Liouville (Capítulo 10) com funções 
coeficientes p = 1 e 

a(£) = —A + 2q cosh 26, a(n) = À — 2q cos2n. (13.182) 


(Essas funções q não devem ser confundidas com o parâmetro q.) Por consegiiência, suas soluções formam 
conjuntos ortogonais de funções. A substituição n — i transforma a EDO angular de Mathieu em EDO radial de 
Mathieu, portanto suas soluções guardam estreita relação. 


Usando a substituição de Lindemann-Stieltjes z = cos? n, dz/dm = —sen 2n, a EDO angular de Mathieu é 
transformada em uma EDO com coeficientes que são algébricos na variável z (usando + = gz E = —sen2m 4 e 
n n dz z 
2 2 
dz = —2cos2n& + sen?on ds): 

dO dB 
4-2) 5 +20 20) t [A + 2q(1 — 22)]® = 0. (13.183) 

z z 


Essa EDO tem singularidades regulares em z = 0 e z = 1, ao passo que o ponto no infinito é uma regularidade 
essencial (Capítulo 9). Por comparação, a EDO hipergeométrica tem três singularidades regulares. Mas nem todas 
as EDOs com duas singularidades regulares e uma singularidade essencial podem ser transformadas em uma EDO 
do tipo Mathieu. 
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Exemplo 13.6.2  pênDuLo Quântico 

Um pêndulo plano de comprimento l e massa m com potencial gravitacional V(0) = —mgl cos 0 é denominado 
pêndulo quântico se sua função de onda Y obedece à equação de Schrödinger 

R dy 

2ml? dg? 


+ [V(9)- E]¥ =0, (13.184) 


em que a variável 6 é o deslocamento angular em relação à direção vertical. (Para mais detalhes e ilustrações, 
referimo-nos a Gutiérrez-Vega et al. em Leituras Adicionais.) Uma condição de contorno aplica-se a W, de modo 
que ela seja de valor único; isto é, W(0 + 27) = Y (0). Substituindo 


8Eml? 4m?gl’ 
0 = 2n, à= > 1=-—» (13.185) 
na equação de Schrödinger, resulta na EDO angular de Mathieu, para W(2(m + 7)) = V(2n). E 


Para muitas outras aplicações que envolvem funções de Mathieu referimo-nos a Ruby em Leituras Adicionais. 
Nosso foco principal serão as soluções da EDO angular de Mathieu, que tem uma importante propriedade: sua 
função coeficiente é periódica com período r. 


Propriedades Gerais de Funções de Mathieu 

Em aplicações físicas, as funções angulares de Mathieu têm de ser de valor único, isto é, periódicas com período 27. 
Vamos começar com um pouco de nomenclatura. Uma vez que as EDOs de Mathieu são invariantes sob paridade 
(n — —n), funções de Mathieu têm paridade definida. As de paridade ímpar que têm período 27 e, para q pequeno, 
começam com sen(2n + 1)n são denominadas se 2n+1(7, q), sendo n inteiro, n = 0,1,2,... (se é abreviatura de 
senoidal-elíptica). Funções de Mathieu de paridade ímpar e período m que começam com sen 2nm para q pequeno 
são denominadas se 2n (1, q), com n = 1,2,... Funções de Mathieu de paridade par, período 7, que começam com 
cos 2nm para q pequeno são denominadas ces, (n, q), abreviatura de co-senoidal-elíptica), enquanto as de período 
27 que começam com cos(2n + 1)n,n = 0,1,... para q pequeno são denominadas ce 2,1 (7, q). No limite, onde 
o parâmetro q — 0 (e a EDO de Mathieu se torna a EDO do oscilador harmônico clássico), as funções de Mathieu 
se reduzem a essas funções trigonométricas. 

A condição de periodicidade ®(n + 27) = (n) é suficiente para determinar um conjunto de autovalores À em 
termos de q. Uma analogia elementar desse resultado é o fato de que uma solução da EDO do oscilador harmônico 
clássico u” (n) + Au(m) = 0 tem período 27 se, e somente se, À = n? for o quadrado de um inteiro. Tais problemas 
serão estudados na Seção 14.7 como aplicações da série de Fourier. 


Exemplo 13.6.3 Funções RADIAIS DE MATHIEU 
Substituindo a variável elíptica angular 7 — i£, a EDO angular de Mathieu, Equação (13.181), se torna a EDO 
radial, Equação (13.180). Isso motiva as definições de funções radiais de Mathieu como 


Cesn+p(€,4) = Cep pliés0): p= 0,1; n = Ol psi, 
Seon+p (É, q) = —iseon +p(ié, q), p= 0,1; n= Zn os 


Como são diferenciáveis, essas funções correspondem às soluções regulares da EDO radial de Mathieu. Claro que 
elas não são mais periódicas e sim, oscilatórias (Figura 13.8). 

Em problemas físicos que envolvem coordenadas elípticas, a EDO radial de Mathieu, Equação (13.180), 
desempenha um papel correspondente ao da EDO de Bessel em geometria cilíndrica. Como há quatro famílias de 
funções de Bessel independentes — as soluções regulares J, e as funções irregulares de Neumann N,,, juntamente 
com as funções modificadas de Bessel Z, e K, —, esperamos quatro tipos de funções radiais de Mathieu. Por causa 
da paridade, as soluções se subdividem em funções de Mathieu pares e ímpares, portanto há oito tipos. Para q > 0, 


Jeon(E, q) T Ceon(E, q), Jeon+i (E, q) Cesn+i (E, q), 
Jozn (£, q) = Se2n (£, q), Jo2n+1(£,q) = Se2n+1 (£, q), regular ou da primeira espécie; 
Nen (£, q), Non(£, q), irregular ou da segunda espécie; 


para q < 0, as soluções da EDO radial de Mathieu são denotadas por 


Ien (£, q), Ion (£, q), regular ou da primeira espécie, 


Ke, (£, q), Kon (£, q), irregular ou da segunda espécie 


“livro” — 2007/8/1 — 15:06 — page 662 — #672 


662 Física Matemática Arfken e Weber ELSEVIER 


Figura 13.8: Funções radiais de Mathieu: q = 1 (linha sólida), q = 2 (linha interrompida), q = 3 (linha pontilhada). 
(De Gutiérrez-Vega et al., Am. J. Phys. 71: 233 (2003).) 


e são conhecidas como funções radiais evanescentes de Mathieu. Dessa mesma forma, podemos definir funções de 
Mathieu correspondentes às funções de Hankel. Algumas delas estão representadas na Figura 13.8. 

Em aplicações como as do cabeçote de cilindro vibratório com condições de contorno elípticas (veja o 
Exemplo 13.6.1), a solução pode ser expandida em funções de Mathieu pares e ímpares: 


zen = Jen(E, q)cen (n, q) cos(wnt), m > 0, 
z0n = Jon (£, q)sen (n, q) cos(wnt), m>1. 


Elas obedecem às condições de contorno de Dirichlet, ze, (£g, N, t) = 0 = zon (£o; N, t), que são válidas contanto 
que as funções radiais satisfaçam Je, (£g, q) = 0 = Jon (£o, q) contorno elíptico, em que £ = £g. 

Quando a distância foca c — 0, as funções angulares de Mathieu se tornam funções trigonométricas 
convencionais, enquanto as funções radiais de Mathieu se tornam funções de Bessel. 

No caso de oscilações de um lago elíptico anular confocal, os modos têm de incluir funções de Mathieu da 
segunda espécie e, por isso, são dadas por 

Zen = [AJen (6,9) + BNen(£, q) |cen (n, q) cos(wnt), 0, 

Z0n = [AJon(€, q) + BNon (£, q) |sen(n, q) cos(wnt), , 


m > 
m > 


com 4, B constantes. Essas soluções de onda estacionária devem obedecer às condições de contorno de Neumann 
nos contornos elípticos internos (É = £o) e externas (€ = £,), isto é, as derivadas normais (uma “linha”o denota 
d/dé) de zen e zon desaparecem em cada ponto das fronteiras. Para modos pares, temos ze! (£9,n,t) = 0 = 
ze; (£1, n, t). As restrições radiais implícitas são semelhantes às Equações (11.81) e (11.82) do Exemplo 11.3.1. 
Exemplos numéricos e gráficos, também para ondas progressivas, são dados em Gutiérrez-Vega et al. em Leituras 
Adicionais. E 


Quanto a zeros de funções de Mathieu, suas expansões assintóticas e uma listagem mais completa de fórmulas, 
referimo-nos a Abramowitz e Stegun (AMS-55) em Leituras Adicionais, Am. J. Phys. 71, Jahnke e Emde e 
Gradshteyn e Ryzhik em Leituras Adicionais. 

Para ilustrar e dar suporte à nomenclatura, queremos mostrar! que há um função angular de Mathieu que é 
e par em 7 e de período 7 se, e somente se, D/ (7/2) = 0; 

e ímpar e de período 7 se, e somente se, Do(7/2) = 0; 


16Veja Hochstadt em Leituras Adicionais. 
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e par e de período 27, se, e somente se, Di (7/2) = 0; 
e ímpar e de período 27, se, e somente se, D5(7/2) = 0, 


em que d;(n) e Bo (m) são duas soluções linearmente independentes da EDO angular de Mathieu, de modo que 
Di(0)=1, (0) = 0; D5(0) = 0, d5(0) = 1. (13.186) 


Uma vez que a EDO de Mathieu é uma EDO de segunda ordem, sabemos (Capítulo 9) que essas condições 
iniciais são realistas. O primeiro caso que acabamos de dar corresponde a ce2n(n,q), com Bi(m/2) = 
—2nsen 2nm|n=/2 + + = 0 para n = 1,2,... O segundo é se» (7, q), com B>(7/2) = sen 2nN|r/2 +: = 0. 
O terceiro caso é o ces, 411,4), com By(m/2) = cos(2n + 1)m/2 +--: = 0. O quarto caso é o se2n+1 (7, q). 

A chave da prova é a abordagem de Floquet para as EDOs lineares de segunda ordem com funções coeficiente 
periódicas, tal como a EDO angular de Mathieu ou o pêndulo simples (Exercício 13.6.1). Se ®ı (n) e P2(n) são 
duas soluções linearmente independentes da EDO, qualquer outra solução & pode ser expressa como 


(n) = Pi(n) + c282(7), (13.187) 


com constantes cy, C2. Agora, ®(n + 27) também são soluções porque uma EDO como essa é invariante sob a 
translação n — n + 27 e, em particular, 


6i(n +27) = ay Bi (n) + asBo(n), 
a(n + 27) = bıı (N) + boBo(n), (13.188) 


com constantes a;, bj. Substituindo a Equação (13.188) na Equação (13.187), obtemos 
(n + 27) = (cia + cab) Bi(n) + (cabo + cias) Bo(m), (13.189) 
em que as constantes c; podem ser escolhidas como soluções das equações de autovalor 


aıcı + bico = Aa, 
aQCy T boca Ea Aco. (13.190) 


Então, o teorema de Floquet afirma que (n + 27) = AB(m), em que À é uma raiz de 


a — À bi 


e E im 0. (13.191) 


Obtemos um corolário útil se definirmos ju e y por À = exp (274) e y(n) = exp (— um) P(n), portanto 


y(n +27) = e ee(n + 27) = ee(n) = y(n). (13.192) 


Assim, ®(n) = e!"y(n), sendo y uma função periódica de n com período 2r. 
Vamos aplicar o argumento de Floquet às P(n + 7), que também são soluções da EDO de Mathieu porque a 
última é invariante sob a translação n — n + 7. Usando os valores especiais na Equação (13.186), sabemos que 


i(n +r) = (r) (n) + Di(7)Do(m), 
Da(n + T) = 2(1)1 (n) + Bo(7)Do(1m), (13.193) 


porque essas combinações lineares de P(n) são soluções da EDO de Mathieu com os valores corretos ®;(n + 
T), &:(m + 7), para n = 0. Por conseguinte, 


i(n +7) = AB:(n), (13.194) 


em que À; são as raízes de 


=0. (13.195) 


O termo constante na polinomial característica é dado pelo wronskiano 


W (®1 (n), Bo(m)) = C, (13.196) 


“livro” — 2007/8/1 — 15:06 — page 664 — #674 


664 Física Matemática Arfken e Weber ELSEVIER 


uma constante porque o coeficiente de dd /dr na EDO angular de Mathieu desaparece, implicando dW/dn = 0. 
De fato, usando a Equação (13.186), 


W (®1(0), D>(0)) = 9:(0)94(0) — D/(0)D>(0) = 1 
= W(di(m), ®2(7)), (13.197) 


portanto o autovalor da Equação (13.195) para À se torna 


(Di(m) — A)(Do(m) — À) — Do(m)Bi (7) = 0 
=)? — [di(7)+(mM|A+I, (13.198) 


com A ž As =le Ai + Aa = (r) + (r). 

Se |A| = |Ao| = 1, então À, = exp (id) e À» = exp (—i¢ġ), portanto À + À» = 2 cos ġ. Para d £0,7,27,... 
esse caso corresponde a [Di (7) + D5(7)| < 2, em que ambas as soluções permanecem ligadas, à medida que 
n — œ em etapas de 7 usando a Equação (13.194). Esses casos não resultam em funções periódicas de Mathieu, 
e isso também acontece quando |®; (m) + Bi5(m)| > 2. Se 4 = 0, isto é, A = 1 = Às for uma raiz dupla, então 
as ®; têm período r e |Di(7) + D5(7)| = 2. Se ġ = 7, isto é, À = —1 = Às for, mais uma vez, uma raiz dupla, 
então |Di (7) + D5(m)| = —2 e as ®; têm período 27 com (n + 7) = —O;(n). 

Como a EDO angular de Mathieu é invariante sob uma transformação de paridade n — —n, é conveniente 


considerar soluções 
De(m) = Læn) +8(-n)], (n) = Læt) — &(—n)] (13.199) 


de paridade definida, que obedecem às mesmas condições iniciais que &;. Agora, renomeamos BD. — D,,D, — 
&,, considerando que 9; é par e P2 é ímpar sob paridade. Essas soluções de paridade definida da EDO de Mathieu 
são denominadas funções de Mathieu e rotuladas de acordo com a nomenclatura que discutimos antes. 

Se 9,(n) tiver período 7, então D/(m + 7) = (n) também tem período m, mas é impar sob paridade. 
Substituindo 7 = —7/2, obtemos 


dus E a PA ; (TN = 
a(z) = i( =) a(z) então, a(3) : (13.200) 


Ao contrário, se 9) (7/2) = 0, então ®; (7) tem período 7. Para ver isso, usamos 
i(n + T) = crBi(m) + coBo(n). (13.201) 


Essa expansão é válida porque ®ı (m + 7) é uma solução da EDO angular de Mathieu. Agora determinamos os 
coeficientes c;, fazendo n = —7/2, e recordando que 9, e &; são pares sob paridade, ao passo que do e D/ são 
ímpares. Isso resulta em 


(13.202) 


Uma vez que Bi (7/2) = 0, B5(m/2) £ 0, ou o wronskiano desapareceria e resultaria Po ~ dB. Daí, c2 = 1 
resulta da segunda equação e cı = 1 da primeira. Assim, ®ı (n + 7) = Bi(m). Os outros casos que apresentamos 
antes podem ser provados de modo semelhante. 

Como as EDOs de Mathieu são do tipo Sturm-Liouville, as funções de Mathieu representam sistemas ortogonais 
de funções. Portanto, para m, n inteiros não-negativos, as relações de ortogonalidade e normalizações são 


i CemCen dn = J. SEmSEn dn = 0, sem Æ n; 
/ Cemsen dm = 0; (13.203) 


= 


Í [cezan]? dn = / [sen]? dm = 7, sen > T; / [ceo(m, q)| É dn =T. 
0 
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Se uma função f(n) for periódica com período 7, então ela pode ser expandida em uma série de funções ortogonais 
de Mathieu como 


1 oo 
f(n) = 590 ceo(n, q) + > [an ce2n(n, a) + bn scan(m 9)] AAN 
n=1 
com 
1 EA 
an=- F(n)cezn(n, q) dn, n > 0; 
-r (13.205) 
1 
bn — = f(n)sezn(n, q) dn, n 2 1. 


Existem expansões semelhantes para funções de período 27 em termos de Ce2n+1 € Seon+1.- 
Expansões de série de funções de Mathieu serão derivadas na Seção 14.7. 


Exercícios 
13.6.1 Para a EDO do pêndulo simples da Seção 5.8, aplique o método de Floquet e derive as propriedades 
de suas soluções semelhantes às apresentadas antes da Equação (13.186). 


13.6.2 Derive uma função de Mathieu análoga para a expansão de Rayleigh de uma onda plana para 
cos(k cos n cos 0) e sen(k cos y cos 0). 
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Séries de Fourier 


14.1 Propriedades Gerais 
Fenômenos periódicos envolvendo ondas, máquinas rotativas (movimento harmônico) ou outras forças de impulsão 
repetitivas são descritos por funções periódicas. As séries de Fourier são uma ferramenta básica para resolver 
equações diferenciais ordinárias (EDOs) e equações diferenciais parciais (EDPs) com condições de contorno 
periódicas. Integrais de Fourier para fenômenos não-periódicos são desenvolvidas no Capítulo 15. O nome comum 
deste campo é análise de Fourier. 

Uma série de Fourier é definida como uma expansão de uma função ou representação de uma função em uma 
série de senos e co-senos, tal como 


Fla) = nr Ano DO Date na. (14.1) 


Os coeficientes ao, an, € bn estão relacionados à função periódica f(x) por integrais definidas: 


1 27 

An = — (x) cos na dz, (14.2) 
T Jo 
1 27 

ba = — (x)sen na dz, n=0,1,2,..., (14.3) 
T Jo 


que estão sujeitas ao requisito da existência das integrais. Note que ao é destacado para tratamento especial pela 
inclusão do fator > de modo que a Equação (14.2) se aplicará a todo an, n = 0, bem como n > 0. 

As condições impostas a f (x) para tornar válida a Equação (14.1) são que f(x) tenha somente um número finito 
de descontinuidades e somente um número finito de valores extremos, máximos e mínimos no intervalo [0, 27].! 
Funções que satisfaçam essas condições podem ser denominadas regulares parte por parte. As condições em si são 
conhecidas como condições de Dirichlet. Embora haja algumas funções que não obedecem a essas condições de 
Dirichlet, elas podem perfeitamente ser denominadas como patológicas para a finalidade de expansões de Fourier. 
Na vasta maioria dos problemas de Física que envolvem uma série de Fourier, essas condições serão satisfeitas. 
Em grande parte dos problemas físicos estaremos interessados em funções que são integráveis ao quadrado (no 
espaço de Hilbert L? da Seção 10.4). Nesse espaço os senos e co-senos formam um conjunto ortogonal completo, 
o que, por sua vez, significa que a Equação (14.1) é válida no sentido da convergência da média. 


Expressando cos nx e sen nx em forma exponencial, podemos reescrever a Equação (14.1) como 


Fe E qe (14.4) 
na qual 
1 ; 1 ; 
Cn = 9 (In Zi ibn), C-n = 3 (Am + ibn), n>0, (14.5a) 
e 
1 
co = 58%: (14.5b) 


"Essas condições são suficientes, mas não necessárias. 


667 


“livro” — 2007/8/1 — 15:06 — page 668 — #678 


668 Física Matemática Arfken e Weber ELSEVIER 


Variáveis Complexas — Teorema de Abel 
Considere uma função f(z) representada por uma série convergente de potências 


JS Cr = Gral: (14.6) 
n=0 n=0 
Essa é nossa série exponencial de Fourier, Equação (14.4). Separando partes real e imaginária, obtemos 
u(r,0) = 5 Cnr” cos n0, v(r,0) = 5 Cnr” sennð, (14.7a) 
n=0 n=1 


a série de Fourier de co-seno e seno. O teorema de Abel afirma que, se u(1,0) e v(1,0) são convergentes para um 
dado 9, então 


u(1,9) + iv(1,9) = lim F(re'?). (14.7b) 


Uma aplicação disso aparece no Exercício 14.1.9 e no Exemplo 14.1.1. 


Exemplo 14.1.1 SOMATÓRIO DE UMA SÉRIE DE FOURIER 


Neste capítulo, em geral estaremos mais preocupados em achar os coeficientes da expansão 
de Fourier de uma função conhecida. Ocasionalmente, inverteremos o processo para determinar a função 
representada por uma determinada série de Fourier. 

Considere a série 5 ,(1/n) cos ng, x € (0,27). Visto que essa série é apenas condicionalmente convergente 
(e diverge em x = 0), consideramos 


= lim X` a (14.8) 
r—=l1 n 


oo DON tia 
y COS NT T COSNT 
n 
n=1 n=1 


como absolutamente convergente para |r| < 1. Nosso procedimento é tentar formar séries de potências 
transformando as funções trigonométricas para a forma exponencial: 


oo oo 

> r” cosna 1 y r 
n 72 

n=1 n=1 


Agora, essas séries de potências podem ser identificadas como expansões de Maclaurin de — In(l — 2),z = 
ret? re '7 (Equação (5.95)), e 


1 rre 
o . (14.9) 


e 
n 


2 r" cosng 1 iz Es 
5 r = zl(1 re )+In(1 — re )] 


n=1 


= —In[(1 + r?) — 2r cos z] °. (14.10) 


Fazendo r = 1 e usando o teorema de Abel, vemos que 


yaos In(2 — 2 cos x) !/? 
n 


n=1 


2 Lii (2sen5), a € (0,27)? (14.11) 


ambos os lados dessa expressão divergem quando x — 0 e 27. 


2Os limites podem ser deslocados para [—7, 7] (e x # 0) usando |x] no lado direito. 
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Completude 


O problema de estabelecer a completude pode ser abordado de vários modos diferentes. Um deles é transformar a 
série trigonométrica de Fourier para a forma exponencial e compará-la com uma série de Laurent. Se expandirmos 
f(z)) em uma série de Laurent? (admitindo que f(z) é analítica), 


ID= E dh”. (14.12) 
No círculo unitário z = e'? e 
KA= S= A dn. (14.13) 
fo) 6 10termos 
4 
X 
T 


Figura 14.1: Representação de Fourier de onda em dente de serra. 


A expansão de Laurent no círculo unitário (Equação (14.13)) tem a mesma forma que a série complexa de 
Fourier (Equação (14.12)), o que mostra a equivalência entre as duas expansões. Uma vez que a série de Laurent, 
por ser uma série de potências, tem a propriedade de completude, vemos que as funções de Fourier e'"? formam 
um conjunto completo. Aqui há uma limitação significativa. Séries de Laurent e séries de potências complexas não 
podem tratar descontinuidades como uma onda quadrada ou a onda em dente de serra da Figura 14.1 exceto no 
círculo de convergência. 

A teoria de espaços vetoriais oferece uma segunda abordagem para a completude dos senos e co-senos. Nesse 
caso, a completude é estabelecida pelo teorema de Weierstrass para duas variáveis. A expansão de Fourier e a 
propriedade de completude podem ser esperadas porque as funções sen nx, cos nx, e*”” são todas autofunções de 
uma EDO linear auto-adjunta 


y" + n2y = 0. (14.14) 
Obtemos autofunções ortogonais para diferentes valores do autovalor n para o intervalo [0, 27] que satisfazem as 


condições de contorno na teoria de Sturm-Liouville (Capítulo 10). Diferentes autofunções para o mesmo autovalor 
n são ortogonais. Temos 


27 
/ sen masen ng dx = i Tômn, mea (14.15) 
0 0, m = 0, 
27 
j cos mg cos ng dz = i Tômn, Kos (14.16) 
0 27, m=n=0, 
27 
J sen ma cosna dx = O para todo inteiro m e n. (14.17) 
0 


3 Seção 6.5. 
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Note que qualquer intervalo xy < x < xo + 27 será igualmente satisfatório. Frequentemente, usaremos xo = —7 
para obter o intervalo —7 < x < 7. A ortogonalidade para as autofunções complexas e>'"”” costuma ser definida 
em termos do conjugado complexo de um de dois fatores, 


27 
/ (EE e? de = 2rômn. (14.18) 
0 


Essa expressão está de acordo com o tratamento dos harmônicos esféricos (Seção 12.6). 


Teoria de Sturm-Liouville 

A teoria de Sturm-Liouville garante a validade da Equação (14.1) (para funções que satisfazem as condições de 
Dirichlet) e utilizar as relações de ortogonalidade, Equações (14.15), (14.16) e (14.17), nos permite calcular os 
coeficientes de expansão an, bn, como mostram as Equações (14.2) e (14.3). Substituindo as Equações (14.2) e 
(14.3) na Equação (14.1), escrevemos nossa expansão de Fourier como 


1 27 
= Od 
1 oo 27 2T 
+- 5 (cos na f(t) cos nt dt + sen ng f(t)sen nt at) 
Tz 0 0 
n=1 
1 27 1 SO 27 
= — f(t) dt + — 5 / f(t) cosn(t — x) dt, (14.19) 
27 0 T El 0 


sendo que o primeiro termo (constante) é o valor médio de f(x) no intervalo [0, 27]. A Equação (14.19) oferece 
uma abordagem para o desenvolvimento da integral de Fourier e de transformadas de Fourier, Seção 15.1. 

Um outro modo de descrever o que estamos fazendo aqui é dizer que f(x) é parte de um espaço de Hilbert 
de número infinito de dimensões, tendo cos na e sen nx ortogonais como base. (Eles sempre podem voltar a 
ser normalizados para a unidade, se desejado.) Afirmar que cosng e sen nx (n = 0,1,2,...) abrangem esse 
espaço de Hilbert equivale a dizer que eles formam um conjunto completo. Por fim, os coeficientes de expansão 
an € bn correspondem às projeções de f(x), com as integrais de produtos internos (Equações (14.2) e (14.3)) 
desempenhando o papel do produto escalar da Seção 1.3. Esses pontos são esboçados na Seção 10.4. 


Exemplo 14.1.2 ONDA EM DENTE DE SERRA 


Podemos ter uma idéia da convergência de uma série de Fourier e do erro pela utilização de apenas um número 
finito de termos na série considerando a expansão de 


Jg, 0O<ar<r, 
fue i z— 2r, t<1<27. (5420) 


Essa é uma onda em dente de serra e, por conveniência, vamos deslocar nosso intervalo de [0,27] para [—7, 7]. 
Nesse intervalo temos f(x) = x. Usando as Equações (14.2) e (14.3), mostramos que a expansão é 


sen2x | senda senna 
a 1)2+1 
2 a; 3 PE n cá 


fla)=2=2 sena (14.21) 


A Figura 14.1 mostra f(x), para0 < a < 7, para a soma de 4, 6 e 10 termos da série. Três características merecem 

comentário. 

1. Há um aumento constante na precisão da representação à medida que aumenta o número de termos incluídos. 

2. Todas as curvas passam pelo ponto do meio, f(x) = 0, em x = 7. 

3. Na vizinhança de x = 7 há um aumento excessivo momentâneo (overshoot) que persiste e não mostra nenhum 
sinal de diminuição. 


Apenas por uma questão de interesse incidental, fazendo x = 7/2 na Equação (14.21), temos uma derivação 


alternativa da fórmula de Leibniz, Exercício 5.7.6. m 
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Comportamento de Descontinuidades 
O comportamento de uma onda em dente de serra f(x) em « = 7 é um exemplo de uma regra geral que diz que 
em uma descontinuidade finita a série converge para a média aritmética. Para uma descontinuidade em x = xo a 
série resulta em 
Fax) = 5 [f (£0 + 0) + (xo — 0)], (14.22) 

a média aritmética entre as aproximações a x = xy pela esquerda e pela direita. Uma prova geral usando somas 
parciais, como na Seção (14.5), é dada por Jeffreys e Jeffreys e por Carslaw (veja as Leituras Adicionais). A prova 
pode ser simplificada pelo uso das funções delta de Dirac, Exercício 14.5.1. 

O overshoot da curva em dente de serra antes de x = 7 na Figura 14.1 é um exemplo do fenômeno de Gibbs 
discutido na Seção 14.5. 


Exercícios 
14.1.1 Uma função f(x) (de quadrado integrável ) deve ser representada por uma série de Fourier finita. 
Uma medida conveniente da precisão da série é dada pela integral do quadrado do desvio, 


27 p 2 
Ap= p [to PE > an cosna + basen nx) | dz. 
0 2 n=1 
Mostre que o requisito de minimização de A,, isto é, 
Ap A 
= 0 P-Q 
dan é Ob, / 


para todo n, leva à escolha de a, e bn como dados nas Equações (14.2) e (14.3). 
Nota: Os coeficientes a, e bn são independentes de p. Essa independência é uma conseqüência da 
ortogonalidade e não seria válida para potências de x, ajustando uma curva com polinômios. 


14.1.2 Na análise de uma forma de onda complexa (marés oceânicas, terremotos, tons musicais etc.) talvez 
fosse mais conveniente escrever a série de Fourier como 


f(x) = > + 5 Qn cos(na — On). 


n=1 
Mostre que essa expressão equivale à Equação (14.1), com 
An = An COS Ôn, a2 = as + b2, 
bn = ansen 0, tgn = bn/an. 
Nota: Os coeficientes œ? como uma função de n definem o que denominamos espectro da po- 
tência. A importância de a2 é sua invariância sob um deslocamento na fase 0n. 
14.1.3 Uma função f(x) é expandida em um série exponencial de Fourier 


OO 


f(x) = 5 En, 
Se f(x) for real, f(x) = f*(x), qual restrição é imposta aos coeficientes cn? 
14.1.4  Admitindo que f” [f(a)]2 da é finita, mostre que 


lim am = 0, lim bm = 0. 
Sugestão: Integre [f(x) — sn(x)]2, em que s, (x) é a enésima soma parcial e use a desigualdade 
de Bessel, Seção 10.4. Para nosso intervalo finito a suposição de que f(x) é de quadrado integrável 
(JE |Z (x)|? da é finita) implica que f7 |f (x)| da: também é finita. O contrário não é verdadeiro. 


14.1.5 Aplique a técnica do somatório desta seção para mostrar que 


n 


se. Une), O<x<7 
—4(r + £x), -r <r<0 


n=1 


(Figura 14.2). 
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X 
Figura 14.2: Onda em dente de serra inversa. 
14.1.6 Some a série trigonométrica Em 
na Senna 
cy 
n=1 
e mostre que é igual a xz/2. 
14.1.7 Some a série trigonométrica S5 
se sen(2n + 1)x 
PE 2n +1 
e mostre que é igual a 
T/4, O<T<T 
—n/4, —1<a<0. 
14.1.8 Calcule a soma da série de Fourier finita de seno para a onda em dente de serra, f(x) = x, (—7,7), 
Equação (14.21). Use a série de termos 4, 6, 8 e 10 e x/r = 0,00(0,02)1,00. Se houver uma rotina 
de construção de gráficos disponível, construa um gráfico com seus resultados e compare com a 
Figura 14.1. 
14.1.9 Sea f(z) = ln(1 + 2) = Xp (—1)"tz" /n. (Essa série converge para In(1 + z) para |z| < 1, 


exceto no ponto z = —1.) 
(a) Pela parte real, mostre que 


9 cos nô 
ED | n+1 
In (2 cos 5) 2 1) ma TLT. 


(b) Usando uma troca de variável, transforme a parte (a) em 


0 ~X cosnf 
-tn (2sen5) = e 0<0<2r. 


n=1 


14.2 Vantagens, Usos da Série de Fourier 


Funções Descontínuas 

Uma das vantagens de uma representação de Fourier sobre alguma outra representação, tal como uma série de 
Taylor, é que ela pode representar uma função descontínua. Um exemplo é a onda em dente de serra da seção 
anterior. Outros exemplos são considerados na Seção 14.3 e nos exercícios. 
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Funções Periódicas 
Relacionada com essa vantagem está a utilidade de uma série de Fourier na representação de uma função 
periódica. Se f(x) tiver um período 27, talvez seja muito natural expandi-la em uma série de funções com período 
21,27/2,2n/3,.... Isso garante que, se nossa f(x) periódica é representada em um intervalo [0,27] ou [—7, 7], 
a representação vale para todo « finito. 

Nesse ponto é conveniente considerar as propriedades de simetria. Usando o intervalo [—7, 7], sen x é ímpar e 
cos x é uma função par de x. Daí, pelas Equações (14.2) e (14.3), se f(x) for ímpar, todos os an = 0 e se f(x) 
for par, todos os b, = 0. Em outras palavras, 


f(x) = > i > ancosng, f(x) par, (14.23) 
Fla) = 5 bnsen ng, f(x) ímpar, (14.24) 
n=1 


Fregiientemente essas propriedades são úteis para expandir uma função dada. 
Notamos que a série de Fourier é periódica. Isso é importante quando consideramos se a Equação (14.1) é válida 
fora do intervalo inicial. Suponha que temos apenas que 


fla)=«, 0O<u<r (14.25) 


e que nos pedem para representar f(x) por uma expansão de série. Vamos considerar três entre o número infinito 
de expansões possíveis. 
1. Se admitirmos uma expansão de Taylor, temos 


Ha)=a, (14.26) 


uma série de um termo. Essa série (de um termo) é definida para todo « finito. 

2. Usando a série de Fourier de co-senos (Equação (14.23), e por isso admitindo que a função é representada 
fielmente no intervalo [0, 7) e estendida aos intervalos vizinhos usando as propriedades de simetria conhecidas, 
prevemos que 


f(x) = =; -mr <x<0, 
flo)=2n-2, m<g<2r. (14.27) 
3. Por fim, pela série de Fourier de senos (Equação (14.24)), temos 
f(x) =, —T<]u<o0, 
f(z) =x- 2r, T< T. (14.28) 
Cada uma dessas três possibilidades — série de Taylor, série de Fourier de co-senos e série de Fourier de 


senos — é perfeitamente válida no intervalo original [0, 7]. Fora dele, entretanto, o comportamento dessas séries 
é surpreendentemente diferente (compare com a Figura 14.3). Então, qual das três é correta? Essa pergunta não 
tem resposta, a menos que nos dêem mais informações sobre f(x). Pode ser qualquer das três ou nenhuma delas. 
Nossas expansões de Fourier são válidas no intervalo básico. A menos que saibamos que a função f(x) é periódica 
com um período igual a nosso intervalo básico ou a (1/n) de nosso intervalo básico, não há nenhuma segurança 
de que a representação (Equação (14.1)) terá qualquer significado fora do intervalo básico. 

Além das vantagens de representar funções descontínuas e periódicas, há uma terceira vantagem muito real na 
utilização de uma série de Fourier. Suponha que estejamos resolvendo a equação do movimento de uma partícula 
oscilatória sujeita a uma força de impulsão periódica. A expansão de Fourier da força de impulsão nos dá o termo 
fundamental e uma série de harmônicos. A EDO (linear) pode ser resolvida para cada um desses harmônicos 
individualmente, um processo que pode ser muito mais fácil do que lidar com a força impulsora original. Então, 
contanto que a EDO seja linear, todas as soluções podem ser somadas para obter a solução final.) Isso é mais do 
que apenas um estratagema matemático esperto. 

e Corresponde a achar a resposta do sistema à frequência fundamental e a cada uma das fregiiências harmônicas. 


4Com a faixa de integração —r < x < r. 
“Uma das características mais detestáveis das equações diferenciais não-lineares é que esse princípio da sobreposição não é válido. 
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fœ 
4 


Série de Taylor 


A Série de Fourier de 
“s, co-senos 


+ > x 
AR 
” 
»” Série de Fourier 
” de senos 


Figura 14.3: Comparação entre a série de Fourier de co-senos, a série de Fourier de senos e a série de Taylor. 


Uma questão que às vezes surge é: “Os harmônicos estavam lá o tempo todo ou foram criados por nossa 
análise de Fourier?” Uma resposta compara a resolução funcional em harmônicos com a resolução de um vetor em 
componentes retangulares. As componentes podem até estar presentes, no sentido de que elas podem ser isoladas e 
observadas, mas a resolução certamente não é única. Daí, muitos autores preferem dizer que os harmônicos foram 
criados pela escolha que fizemos da expansão. Outras expansões em outros conjuntos de funções ortogonais dariam 
resultados diferentes. Para uma discussão mais detalhada, referimo-nos a uma série de notas e cartas no American 
Journal of Physics é 


Mudança de Intervalo 
Até aqui nossa atenção ficou restrita a um intervalo de comprimento 27. Essa restrição pode ser relaxada com 
facilidade. Se f(x) for periódica com um período 2L, podemos escrever 


f(x) = > + 2 fe» cos n. + basen ES : (14.29) 
com 
O a t 
An = | f(t) cos dt, n=0,1,2,3,..., (14.30) 
=P 
q nrt 
bn = zS Ht)sen—— dt, n=1,2,3,..., (14.31) 
= 


substituindo x na Equação (14.1) por mx/L e t nas Equações (14.2) e (14.3) por mt/L. (Por conveniência, o 
intervalo nas Equações (14.2) e (14.3) é deslocado para —r < t < 7.) A escolha do intervalo simétrico (— L, L) 
não é essencial. Para f(x) periódica com um período de 2L, qualquer intervalo (£o, xo + 2L) servirá. A escolha 
é uma questão de conveniência ou, literalmente, de preferência pessoal. 


Exercícios 
14.2.1 As condições de contorno (tal como w)(0) = (l) = 0) podem sugerir soluções da forma 
sen(nrz/l) e eliminar os co-senos correspondentes. 


(a) Verifique que as condições de contorno usadas na teoria de Sturm-Liouville são satisfeitas para 
o intervalo (0, |). Note que isso é apenas metade do intervalo usual de Fourier. 

(b) Mostre que o conjunto de funções q, (x) = sen(nmax/1), n = 1,2,3,..., satisfaz uma relação 
de ortogonalidade 


l 
[o 2 


14.2.2 (a) Expanda f(x) = «x no intervalo (0,2L). Rascunhe a série que encontrou (lado direito da 
resposta) em (—2L, 2L). 


6B. L. Robinson, Concerning frequencies resulting from distortion. Am. J. Phys. 21: 391 (1953); F. W. Van Name, Jr., Concerning frequencies 
resulting from distortion, ibid. 22: 94 (1954). 
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92L 1 NTT 
R ta: x = L ; 
esposta: £ = Dael T, ) 


(b) Expanda f(x) = x como uma série de seno no meio intervalo (0, L). Rascunhe a série que 
encontrou (lado direito da resposta) em (—2L, 2L). 


4L A 1 2n+1 
Resposta: x = = 5 N a Ee), 


n=0 
14.2.3 Em alguns problemas é conveniente aproximar sen mx no intervalo [0, 1] por uma parábola em que 
ax(l — x), a é uma constante. Para ter uma idéia da precisão dessa aproximação, expanda 4x(1 — x) 
em uma série de Fourier de senos (—1 < x < 1): 


_ f 41-2), 0<r<1 | os 
32 1 
RESP. ba = B RE n ímpar 
bn = 0, n par. 
fl) 
—1 1 
} ! > x 


Figura 14.4: Onda senoidal parabólica. 


14.3 Aplicações de Séries de Fourier 


Exemplo 14.3.1 ONDA QUADRADA — ALTAS FREQÜÊNCIAS 

Uma aplicação da série de Fourier, a análise de uma onda “quadrada? (Figura 14.5) em termos de suas 
componentes de Fourier, ocorre em circuitos elétricos projetados para lidar com pulsos que sobem abruptamente. 
Suponha que nossa onda seja definida por 


f(£)=0, -mr <xr<0, 
f(x) =h, Ore (14.32) 
Pelas Equações (14.2) e (14.3), encontramos 
1 T 
ao = | hdt = h, (14.33) 
T Jo 
1 T 
m= hcosntdt = 0, n=1,2,3,..., (14.34) 
T Jo 
1/7 h 
ba = | hsen nt dt = — (1 — cos nr); (14.35) 
T Jo NT 
2h 
bn = —, n ímpar, (14.36) 
nT 


bn =0, npa. (14.37) 
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A série resultante é 


h 2h/senz sen3zx E +) (14.38) 


Ho=5+5( TM É SO 
Exceto pelo primeiro termo, que representa uma média de f(x) no intervalo [—7, 7], todos os termos de co- 
seno desapareceram. Uma vez que f(x) — h/2 é ímpar, temos uma série de Fourier de senos. Embora ocorram 
somente os termos ímpares na série de senos, eles caem em n 1. Essa convergência condicional é como a da série 
harmônica alternante. Em termos físicos, isso significa que nossa onda quadrada contém uma grande quantidade 
de componentes de alta freqiiência. Se o equipamento eletrônico não deixar passar essas componentes, nossa 
entrada de onda quadrada emergirá mais ou menos arredondada, talvez como uma bolha amorfa. = 


fo) 
A 


Figura 14.5: Onda quadrada. 


Exemplo 14.3.2  RETIFICADOR DE ONDA COMPLETA 


Como segundo exemplo, vamos perguntar quão bem a saída de um retificador de onda completa se aproxima da 
corrente direta pura (Figura 14.6). Podemos imaginar que nosso retificador passou os picos positivos de uma onda 
senoidal de entrada e inverteu os picos negativos, o que resulta em 


f(t) = sen wt, O<wt<T, 
(14.39) 
f(t) = —sen wt, =T <wt<0. 
Uma vez que f(t) definida aqui é par, não aparecerá nenhum termo da forma sen nwt. Mais uma vez, pelas 
Equações (14.2) e (14.3), temos 


0 VE 
1 
ao = =| sen wt d(wt) + — J sen wt d(wt) 
—] T Jo 
PO 4 
= zJ sen wt d(wt) = —, (14.40) 
T Jo T 
2 T 
an = — sen wt cos nwt d(wt) 
T Jo 
2- r12 
Ro RM 
= 0, n ímpar. (14.41) 


Note que [0, 7] não é um intervalo de ortogonalidade para senos e co-senos juntos e não obtemos zero para n. par. 
A série resultante é 


2 4 = cos nwt 

ses E ; 

a eR (14.42) 
n=2,4,6,... 

A freqüência original, w, foi eliminada. A oscilação de freqüência mais baixa é 2w. As componentes de alta 

freqüência caem n”2, mostrando que o retificador de onda completa faz um bom trabalho na aproximação da 

corrente direta. Se essa boa aproximação é adequada depende da aplicação particular. Se houver alguma objeção 
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Figura 14.6: Retificador de onda completa. 


contra as componentes ac remanescentes, elas ainda podem ser suprimidas por circuitos de filtro apropriados. Esses 

dois exemplos demonstram duas características importantes das expansões de Fourier.” 

e Se f(x) tiver descontinuidades (como na onda quadrada do Exemplo 14.3.1), podemos esperar que o enésimo 
coeficiente seja decrescente como O(1/n). A convergência é apenas condicional. 

e Se f(x) for contínua (embora possivelmente com derivadas descontínuas, como no retificador de onda 
completa do Exemplo 14.3.2), podemos esperar que o enésimo coeficiente seja decrescente como 1/n2, isto 
é, convergência absoluta. 


E 
Exemplo 14.3.3 SÉRIE INFINITA, FUNÇÃO ZETA DE RIEMANN 
Como exemplo final, considere o problema de expandir x?. Seja 
ftr) = r, -T<T<T. (14.43) 
Uma vez que f(x) é par, todos os b, = 0. Para os an, temos 
1 f7 27º? 
a = if zde = Æ, (14.44) 
TJ r 3 
2 T 
an = F x? cos na dz 
T Jo 
2 27 
= Ses( qn 
z OCD. 
N n 4 
= (—1) = (14.45) 
Disso obtemos 
2 OO 
yor n COSNT 
= — +4 —1 ; 14.46 
Cai 2 is (14.46) 
Assim como está, a Equação (14.46) não tem particular importância. Mas, se fizermos x = 7, 
cosnm = (—1)” (14.47) 
e a Equação (14.46) se torna? 
2 OO 
2 T 1 
= — +4 — 14.48 
As RR > E (14.48) 
ou 
T? i 
E 5 FE (14.49) 
n=1 


7G. Raisbeek, Order of magnitude of Fourier coefficients. Am. Math. Mon. 62: 149-155 (1955). 
Note que o ponto x = 7 não é um ponto de descontinuidade. 
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resultando assim na função zeta de Riemann, ((2), em forma fechada (de acordo com o resultado do número de 


Bernoulli da Seção 5.9). Inúmeras outras séries podem ser avaliadas por nossa expansão de q? e 


por expansões de outras potências de x. Algumas são incluídas nessa lista de exercícios: 


Série de Fourier Referência 
Sd -i(m +2) -n<2<0 Exercício 14.1.5 
Ko = 2 , > 

t x PA i alm— a), 0O<u<r Exercício 14.3.3 

— Exercício 14.1.6 
n+1 Ei = 

É 2 Ue AESA Exercício 14.3.2 
va JJ -r/4, —n<u<0 Exercício 14.1.7 

= m+ q en iS f +7/4, O<T<T Equação (14.38) 
+ cosng |z] Equação (14.11) 

lá > Ra [sen( 5) | aco Exercício 14.1.9(b) 
> 1 

5. 561- cosng = — ln E cos(5)] ; -1<2<7 Exercício 14.1.9(a) 
Ee n 2 

6 3 : Gres iaa <r< 

é >——— COS = co 

2 Iml c n £ 7 n z | TLE<LT 


A série de Fourier da onda quadrada da Equação (14.38) e item 3 na tabela, 


X sen(2n + 1)x an 
ap mi CD o mi<a<(m+lr, (14.50) 


pode ser usada para derivar a equação funcional para a função zeta de Riemann. Sua série definidora 
de Dirichlet pode ser escrita de várias formas: 


G(s) = 5 nº=1+ > (em + > (n+ 1) 


=2""()+> (2n +1), 
n=0 


implicando que a função A(s) definida na Seção 5.9 (juntamente com n(s)) satisfaça 


oO 


Als) = X (2n + 1)7° = (1 — 27°) ¢(8). (14.51) 


n=0 


Aqui, s é uma variável complexa. Ambas as séries de Dirichlet convergem para o = Rs > 1. Alternativamente, 
usando a Equação (14.51), temos 


n(s) = X (=1) tns = X (2n +1) — X (nm) = (1 — 2*8) ¢(s), (14.52) 
n=1 n=0 n=1 


que já converge para Rs > 0 usando o critério de convergência de Leibniz (veja a Seção 5.3). 
Uma outra abordagem para a série de Dirichlet parte da integral de Euler para a função gama, 


J ye" dy = n= f et“y ol dy = n™'T (s), (14.53) 
0 0 


que pode ser somada usando a série geométrica 


(0.6) 
=y 
5 my = e = 1 
l-ey ey—1 
n=1 


para dar a representação integral para a função zeta: 


(e0) s—1 
J Y dy=c(s)T(s). (14.54) 
0 
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Se combinarmos as formas alternativas da Equação (14.53), 
f gs lei dy = naST(s)e™tTs/2, 
0 
/ yT letny dy = nT*T(s)eirs/2, 
0 


obtemos g 
/ yIsen(ny) dy = nT (s)sen T. (14.55) 
(0) 


Dividindo ambos os lados da Equação (14.55) por n e somando sobre todos os n ímpares, temos como resultado, 
para o = R(s) > 0, 


oO 


sy dy = (1 = 2757") ¢(s + DP (s)sen =, (14.56) 
0 
usando as Equações (14.50) e (14.51). Aqui, a permuta entre somatório e integração é justificada pela convergência 
uniforme. Essa relação está no coração da equação funcional. Se dividirmos a faixa de integração em intervalos 
mm < y < (m + 1)r e substituirmos a Equação (14.50) na Equação (14.56), encontramos 


Il 
AIA 
Me 
rio 
= 
3 
~~ 
3 
+ 
J 
S, 
I 
A 
«SS 


f g(y)yT! dy 
0 


m=0 N: 
gst! ea 
= e (—1)” [(m + 1)º — m°] + 1) 
m=1 
= = (1 = 2°t1)¢(-8), (14.57) 


usando a Equação (14.52). Para Rs < 1, a série na Equação (14.57) converge para uma função analítica. 
Comparando as Equações (14.56) e (14.57) para a área comum de convergência com funções analíticas, O < 
o = Rs < 1, obtemos a equação funcional. 


qt TS 
F (1 - 2°+)¢(—s) = (1 — 27°71) ¢(s + DP(s)sen, 
que pode ser reescrita como 

C(L — s) = 2U27)-*C(s)T(5) cos T (14.58) 
Essa equação funcional dá uma continuação analítica de (s) no semi-plano negativo de s. Para s — 1 o pólo 
de ¢(s) e o zero de cos(ms/2) se cancelam na Equação (14.58), portanto resulta em ¢(0) = —1/2. Visto que 
cos(rs/2) = 0, paras = 2m + 1 = inteiro ímpar, a Equação (14.58) dá ¢(—2m) = 0, os zeros triviais da 
função zeta para m = 1,2,... Todos os outros zeros devem estar na “faixa crítica” 0 < o = Rs < 1. Eles estão 


estreitamente relacionados com a distribuição de números primos porque o produto de números primos para ((s) 
(veja a Seção 5.9) pode ser convertido em uma série de Dirichlet sobre potências de números 
primos para ('/C = dln G(s)/ds. Desse ponto em diante apresentamos apenas idéias, mas sem provas. Usando 
a transformada inversa de Mellin (veja a Seção 16.2), temos como resultado a relação 


o-tioo „I 
y AE ANN (14.59) 


p” <a,p=primo 2m1 o-—ioo C(s)s 
m=1,2,... 


para o > 1, que é uma pedra angular da teoria analítica dos números. Uma vez que zeros de C(s) se tornam simples 
pólos de ¢'/Ç, a distribuição assintótica de números primos está diretamente relacionada pela Equação (14.59) aos 
zeros da função zeta de Riemann. Riemann previu que todos os zeros se encontram sobre a reta o = 1/2, isto é, 
eles têm a forma 1/2 + it com t real. Se for assim, podemos deslocar a reta de integração para a esquerda para 
o = 1/2 + £, o pólo simples de ((s) em s = 1, dando origem ao resíduo x, enquanto a integral ao longo da reta 
o = 1/2 + £ é de ordem O(1!/2+º). Por conseguinte, na estimativa assintótica 


XO lnp~ g+ O(t), zr — 00 


p<a 
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resultaria o resto arbitrariamente pequeno para £, o que equivale à estimativa para o número de primos abaixo de 
T, 


aa) = i= f Qui! des O(a), zr — 00. 


p<x 


De fato, estudos numéricos mostraram que os primeiros 300 x 10º zeros são simples e se encontram todos sobre a 
linha crítica o = 1/2. Se o leitor quiser mais detalhes pode consultar o texto clássico de E. C. Titchmarsh e D. R. 
Heath-Brown, The Theory of the Riemann Zeta Function, Oxford, UK: Clarendon Press (1986); H. M. Edwards, 
Riemann's Zeta Function, Nova York: Academic Press (1974) e Dover (2003); J. Van de Lune, H. J. J. Te Riele, 
e D. T. Winter, On the zeros of the Riemann zeta function in the critical strip. IV. Math. Comput. 47: 667 (1986). 
Relatos populares podem ser encontrados em M. du Sautoy, The Music of the Primes: Searching to Solve the 
Greatest Mystery in Mathematics, Nova York: Harper Collins (2003); J. Derbyshire, Prime Obsession: Bernhard 
Riemann and the Greatest Unsolved Problem in Mathematics. Washington, DC: Joseph Henry Press (2003); K. 
Sabbagh, The Riemann Hypothesis: The Greatest Unsolved Problem in Mathematics, Nova York: Farrar, Straus e 
Giroux (2003). 

Mais recentemente a estatística dos zeros p da função zeta de Riemann sobre a linha crítica desempenhou um 
papel proeminente no desenvolvimento de teorias do caos (damos uma introdução no Capítulo 18). Admitindo 
que haja um sistema quanto-mecânico cujas energias são as partes imaginárias dos p, então os números primos 
determinam as órbitas periódicas primitivas do sistema caótico classicamente associado. Para esse caso, a fórmula 
de traço de Gutzwiller, que relaciona níveis de energia quântica e órbitas periódicas clássicas desempenha um 
papel central e pode ser mais bem entendida usando propriedades da função zeta e primos. Se o leitor quiser 
mais detalhes, consulte as Seções 12.6 e 12.7 em J. Keating, The Nature of Chaos (T. Mullin, Ed.), Oxford, UK: 


Clarendon Press (1993), e as referências ali encontradas. E 
Exercícios 
14.3.1 Desenvolva a representação de série de Fourier de 
0, -T Swt <0, 
MeL as O<wi<r. 


Essa é a saída de um retificador simples de meia-onda. Também é uma aproximação do efeito 
térmico solar que produz “marés” na atmosfera. 


t-I 2 > cos nwt 
Resposta: f(t) = = + 5 sen wt E 5 BT 
n=2,4,6,... 
14.3.2 | Uma onda em dente de serra é dada por 
fla)=«, -T<L<T<T. 
Mostre que 
oo ( 1 n+1 
f(£)=2 X sen ng 
n=1 
14.3.3 Uma diferente onda em dente de serra é descrita por 
1 
=; (mt); -r <r<0 
f(x) E i 1 
+3 (7 — 1), O<a<r 
Mostre que f(x) = >", (sen na/n). 
14.3.4 | Uma onda triangular (Figura 14.7) é representada por 
io O<a<r 
f(z) = 
—2, -—T<2<0. 
Represente f(x) por uma série de Fourier. 
4 a! 
Resposta: f(x) = pçs std 
Do Te n? 


ELSEVIER 
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14.3.5 


14.3.6 


14.3.7 


14.3.8 


fœ 
4 


Figura 14.7: Onda triangular. 


Expanda 


no intervalo [—77, 7]. 
Nota: Essa onda quadrada de largura variável tem uma certa importância para a música eletrônica. 


Um tubo cilíndrico de metal de raio a é dividido no sentido do comprimento em duas metades 
que não se tocam. A metade superior é mantida em um potencial +V, a parte inferior, em um 
potencial — V (Figura 14.8). Separe as variáveis em equação de Laplace e resolva para o potencial 
eletrostático para r < a. Observe a semelhança entre sua solução para r = a e a série de Fourier 
para uma onda quadrada. 


+V 


Figura 14.8: Seção transversal de tubo dividido. 


Um cilindro de metal é colocado em um campo elétrico (previamente) uniforme, Ego, com o eixo do 
cilindro perpendicular ao do campo original. 


(a) Ache o potencial eletrostático perturbado. 
(b) Ache a carga superficial induzida no cilindro como uma função de posição angular. 


Transforme a expansão de Fourier de uma onda quadrada, Equação (14.38), em uma série 
de potências. Mostre que os coeficientes de x! formam uma série divergente. Repita para os 
coeficientes de z3. 

Uma série de potências não pode manipular uma descontinuidade. Esses coeficientes infinitos são 
o resultado de tentar vencer essa limitação básica das séries de potências. 


682 
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14.3.9 


14.3.10 


14.3.11 


14.3.12 


14.3.13 


(a) Mostre que a expansão de Fourier de cos ax é 


Zasen ar 1 cos £ cos 2x 
cosax = od, 


T 2a? a2-12 q2-922 


n 2asenam 
An = (— ) z(a? Zn?) 


(b) Pelo resultado precedente, mostre que 


ancotgam = 1 — 25 C(2p)a”. 
p=1 


Essa expressão dá uma derivação alternativa da relação entre a função zeta de Riemann e os números 
de Bernoulli, Equação (5.152). 
Derive a expansão de série de Fourier da função delta de Dirac ó(«:) no intervalo —7 < x < T. 


(a) Que significância pode ser atribuída ao termo constante? 
(b) Em que região essa representação é válida? 


(c) Com a identidade 
N 
sen(Nx/2) Ne 
aa MEUN aN 
A an sen(x/2) cos|( +5)5) 


mostre que sua representação de Fourier de ô(x) é consistente com a Equação (1.190). 
Expanda ô(x — t) em uma série de Fourier. Compare seu resultado com a forma bilinear da 
Equação (1.190). 

1 OO 
Resposta : ô&(x — t) = — +-— > (cos na cos nt + sen nasen nt) 
T 


n=1 


E Ee 
= =— +=) cosn(z — t). 
T ai 


Verifique que 


OO 


1 im S 
lpi = p) = y >, empi =a 


é uma função delta de Dirac mostrando que ela satisfaz a definição de uma função delta de Dirac: 


oO 


J tedi D ente do, = flea). 


m=— oo 


Sugestão: Represente f (p1) por uma série exponencial de Fourier. 
Nota: O contínuo análogo dessa expressão é desenvolvido na Seção 15.2. A aplicação mais 
importante dessa expressão é na determinação de funções de Green, Seção 9.7. 
(a) Usando 
f£) = zr?, -T <T<T, 
mostre que 


oo (=1) 0H T2 
Er e 
n=1 


(b) Usando a série de Fourier para uma onda triangular desenvolvida no Exercício 14.3.4, mostre 
que 


EE 1 T 
D Qn-1)2 8 Ai: 


n=1 
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(c) Usando 
fa) = 2º, -T <T<T, 
mostre que 
L O (=D trt 
2 nt 90 (4), > nt 720 (4) 
(d) Usando 
Jalm—s), O<ac<r, 
o RR m<a<o0, 
derive 
8 > sen nx 
Ha) = = D n3 
n=1,3,5,... 
e mostre que 
< 1 1 1 1 T? 
-q(t-D20 =1 = — = b(3). 
= (1) nº 3º u De -T E 32 ANa) 
(e) Usando a série de Fourier para uma onda quadrada, mostre que 
— 1 1 1 1 T 
efa =1 | =- = B(1). 
Pe aaa 


Essa é a fórmula de Leibniz para 7, obtida por uma técnica diferente no Exercício 5.7.6. 
Nota: As funções n(2), n(4), A(2), B(1) e 5(3) são definidas pela série indicada. Definições 
gerais aparecem na Seção 5.9. 


14.3.14 (a) Ache a representação de série de Fourier de 


oS 0, Ra 


14.3.15 Um pulso triangular simétrico de altura e largura ajustáveis é descrito por 


js ( doce netas 


0, b< |r| <r. 
(a) Mostre que os coeficientes de Fourier são 
ab 2ab 
ag = — an = inn Pes: 
Some a série finita de Fourier até n = 10 e até n = 100 para x/r = 0(1/9)1. Considere a = 1 
eb=m/2. 


(b) Chame uma sub-rotina de análise de Fourier (se disponível) para calcular os coeficientes de 
Fourier de f(x), ao até ao. 


14.3.16 (a) Usando uma sub-rotina de análise de Fourier, calcule os coeficientes de co-senos de Fourier de 


ao até aio de 
NU? 
Hx) = h- (5) | F x E [-r, n]. 


(b) Faça um teste localizado calculando alguns dos coeficientes precedentes por quadratura 
numérica direta. 
Valores de verificação. ao = 0, 785, a2 = 0, 284. 
14.3.17 Usando uma sub-rotina de análise de Fourier, calcule os coeficientes de Fourier até a10 e bio para 
(a) um retificador de onda completa, Exemplo 14.3.2, 
(b) um retificador de meia-onda, Exercício 14.3.1. Verifique seus resultados comparando-os com 
as formas analíticas dadas (Equação (14.41) e Exercício 14.3.1). 
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14.4 Propriedades da Série de Fourier 


Convergência 

Em primeiro lugar, é preciso observar que não devemos esperar que nossa série de Fourier seja uniformemente 
convergente se ela representar uma função descontínua. Uma série uniformemente convergente de funções 
contínuas (sen nx, cos nx) sempre resulta em uma função contínua (compare com a Seção 5.5). Contudo, se 

(a) f(x) for contínua, =r < £ < 7, 

b) f(n) = f(+r) e 

(c) f'(x) for contínua por seções, 

a série de Fourier para f(x) convergirá uniformemente. Essas restrições não exigem que f(x) seja periódica, mas 
serão satisfeitas por funções contínuas, diferenciáveis, periódicas (período de 27). Se o leitor quiser uma prova, 
pode consultar a literatura.” Com ou sem uma descontinuidade em f(x), a série de Fourier dará convergência na 
média, Seção 10.4. 


Integração 
Integração termo a termo da série 
(a) = > + 2 an cos na + 2 by senna (14.60) 
resulta em 
X aor z s An o es bn z 
xz)dr = —| + —sennz| — — cos na 14.61 
fito 2 |. ps E a a (14.61) 


Está claro que o efeito da integração é colocar uma potência adicional de n no denominador de cada coeficiente, o 
que resulta em convergência mais rápida do que antes. Por conseqüência, uma série de Fourier convergente sempre 
pode ser integrada termo a termo, a série resultante convergindo uniformemente à integral da função original. Na 
verdade, a integração termo a termo pode ser válida mesmo se a própria série original (Equação (14.60)) não for 
convergente. A função f(x) precisa apenas ser integrável. Encontramos uma descrição disso em Jeffreys e Jeffreys, 
Seção 14.06 (veja as Leituras Adicionais). 

Em termos estritos, a Equação (14.61) pode não ser uma série de Fourier; isto é, se ao % 0, haverá um termo 
A Contudo, 


1 
/ Fa) da — zao% (14.62) 
zo 
ainda será uma série de Fourier. 


Diferenciação 
A situação da diferenciação é bem diferente da situação da integração. Nesse caso, recomenda-se cautela. 
Considere a série para 


fla)=a, -T <L<T<T. (14.63) 
Constatamos imediatamente (compare com o Exercício 14.3.2) que a série de Fourier é 
psg OO e, TLELT. (14.64) 
n=1 A 
Diferenciando termo a termo, obtemos 
1=253 (1) cosna, (14.65) 
n=1 


que é não é convergente. Atenção: verifique a convergência de sua derivada. 
Para uma onda triangular (Exercício 14.3.4), na qual a convergência é mais rápida (e uniforme), 


Fa) = 


A ee 
E y Lua (14.66) 
TE 


T 
2 n 


n=1,Ímpar 


’Veja, por exemplo, R. V. Churchill, Fourier Series and Boundary Value Problems, 5% ed., Nova York: McGraw-Hill (1993), Seção 38. 
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Diferenciando termo a termo, obtemos 
4 Ea sen nx 
1 
L)=— 14.67 
Paso Da (14.67) 
n=1,ímpar 


que é a expansão de Fourier de uma onda quadrada, 


, — 1, O<T<T, 
Tu= i -1, —n<a<o0. (ELOA) 


A inspeção da Figura 14.7 verifica que essa é, de fato, a derivada de nossa onda triangular. 

e Por ser o inverso da integração, a operação de diferenciação colocou um fator adicional n no numerador de 
cada termo. Isso reduz a taxa de convergência e pode, como no primeiro caso mencionado, converter a série 
diferenciada em divergente. 

e Em geral, diferenciação termo a termo é permissível sob as mesmas condições que relacionamos para a 
convergência uniforme. 


Exercícios 
14.4.1 Mostre que integração da expansão de Fourier de f(x) = x,-m < x < m leva a 


EE e der Pyl E 
27 ce 4 9 16 


14.4.2 Identidade de Parseval. 


(a) Admitindo que a expansão de Fourier de f(x) é uniformemente convergente, mostre que 
If rope- DS toi) 
Tese 2 A 


Essa é a identidade de Parseval. Na verdade, é um caso especial da relação de completude, 
Equação (10.73). 
(b) Dado 


zi 


E 


oo 
P cosna 
ar TIELT, 


aplique a identidade de Parseval para obter ¢(4) em forma fechada. 
(c) A condição de convergência uniforme não é necessária. Mostre isso aplicando a identidade de 
Parseval à onda quadrada. 


—1, -T<2<0 
1, O<T<T 


24 5 sen(2n — 1)x 
On 2n— 1 
n=1 
14.4.3 Mostre que integrar a expansão de Fourier da função delta de Dirac (Exercício 14.3.10) leva à 


representação de Fourier da onda quadrada, Equação (14.38), com h = 1. 
Nota: Integrar o termo constante (1/27) leva a um termo 1/27. E daí? 


14.4.4 Integre a expansão de Fourier da função degrau unitária 


ra= o -r <x1<0 


£, O<T<T. 


Mostre que sua série integrada está de acordo com o Exercício 14.3.14. 


14.4.5 No intervalo (—r, T), 
n, para |z| < 5, 
n (£) = l 2 


0, para |x| > + 


(Figura 14.9). 
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(a) Expanda ô, (x) como uma série de Fourier de co-senos. 
(b) Mostre que sua série de Fourier está de acordo com a expansão de Fourier de ô(«) no limite 
quando n — œ. 


A 8) 
O 


-r T o 
2n 2n 


Figura 14.9: Pulso retangular. 


14.4.6 Confirme a natureza de função delta de sua série de Fourier do Exercício 14.4.4, mostrando que, 
para qualquer f(x) que é finita no intervalo [—7, 7] e contínua em z = 0, 


7 f(x) [Expansão de Fourier de doo(x)] dx = f(0). 


14.4.7 | (a) Mostre que a função delta de Dirac ó(a — a), expandida em uma série de Fourier de senos no 
meio-intervalo (0, L)(O < a < L), é dada por 


= L LJ) 


lx — a) = 


RIM 


Note que essa série na verdade descreve 
—ô(x +a) + ô(x— a) no intervalo (—L,L). 
(b) Integrando ambos os lados da equação precedente de O a x, mostre que a expansão de co-seno 


da onda quadrada 
0, 0O<a<a 
VORRE a<z<L, 


Ox 


2&1 nra 2&1 nra NTT 
ra= Dal L ) O qsen( L ) cos( 27), 


para0 < x < L. 
(c) Verifique que o termo 


é (Fx). 
14.4.8 Verifique a expansão de Fourier de co-seno da onda quadrada, Exercício 14.4.7(b), por cálculo 
direto dos coeficientes de Fourier. 


14.4.9 (a) Uma corda está presa em ambas as extremidades x = 0 e x = L. Admitindo vibrações de 
pequena amplitude, constatamos que a amplitude y(x, t) satisfaz a equação de onda 


02y 1 3y 


ðr? v2 dt 
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Aqui, v é a velocidade da onda. A corda entra em vibração por um golpe seco em x = a. Por 
conseguinte, temos 


ðy(zx, t) 
ot 
A constante L é incluída para compensar as dimensões (comprimento inverso) de ô(x— a). Com 


ô(x — a) dada pelo Exercício 14.4.7(a), resolva a equação de onda sujeita a essas condições 
iniciais. 


y(x,0) = 0, 


= Lvd(z — a) em t = 0. 


2v9oL A 1 nra nrz nqvt 
Resposta: y(x, t) = > >R sen sen sen 
TU 


n=1 


(b) Mostre que a velocidade transversal da corda é dada por dy(x, t)/Ôt 


ðy(x, t) z nra nnz  nrvt 
naa 200 > sen T sen cos : 
n=1 


ot L L 


14.4.10 Uma corda presa em x = 0 e em x = 1 está vibrando livremente. Seu movimento é descrito pela 
equação de onda 


Pulz, t) u(x,t) 


ot? “0 


Admita uma expansão de Fourier da forma 


NTT 


t) = bn(t —— 
ulet) = DO baltsen 
e determine os coeficientes b, (t). As condições iniciais são 
o 
ulz, 0) = f(z) e gt = gle). 


Nota: Isso é apenas metade do intervalo integral de ortogonalidade convencional de Fourier. 
Todavia, contanto que somente os senos sejam incluídos aqui, as condições de fronteira de Sturm- 
Liouville ainda são satisfeitas e as funções são ortogonais. 


t t 
RESP. ba(t) = Apcos a + Basen A, 
2 f! E 
An = J) Ha)sen da, Bn = nN g(x)sen da. 


14.4.11 (a) Vamos continuar com o problema da corda vibrante do Exercício 14.4.10. A presença de um 
meio resistente atenuará as vibrações segundo a equação 
u(x,t) 28 u(x,t) „2u t) 
= UV . 
ot? dx? ot 


Admita uma expansão de Fourier 


NTL 


uls, t) =X bn (t) sen —— 


e novamente determine os coeficientes b, (t). Considere que as condições iniciais e de contorno 
são as mesmas do Exercício 14.4.10. Admita que a atenuação é pequena. 
(b) Repita, mas agora admitindo que a atenuação é grande. 


Resposta: (a) ba(t) = er A, coswnt + Basen wnt}, 
2 l 
An = 7 f(£)sen dr, 
T Jo 7 
2 ! $ 
Ba = aa g(a)sen—— da + 5 An, 
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(b) ba(t) = eMt2LA, cos hont + Bnsen hont}, 
2 l 
An = F f(x)sen E dz, 
E ] 
2 k 
Aa dr + — An, 
e p E 


2 2 
a- -E 


14.4.12 Ache a distribuição de carga sobre as superfícies interiores dos semicírculos do Exercício 14.3.6. 
Nota: Você obtém uma série divergente e essa abordagem de Fourier falha. Usando técnicas de 
mapeamento conformal, podemos mostrar que a densidade de carga é proporcional a csc 0. Essa 
csc 0 tem uma expansão de Fourier? 


14.4.13 Dada 


se = led): -r <x<0, 


mostre, por integração, que 


2 
= E = Hr +e)’ - 5, m<ar<o 
n=1 nen > OSTIT 


14.4.14 Dadas 


É sen ng É cosnz 
Post) = 5 Ths é Pası) = 5 nt? 
n=1 n=1 


desenvolva as seguintes relações de recorrência: 


(a) Past B WPos— 1( x) dg 
(D) bassalz) = C28 41) f Vas) dz. 
0 


Nota: As funções Y, (x) e a função y, (x) dos dois exercícios precedentes são conhecidas como 
funções de Clausen. Em teoria elas podem ser usadas para melhorar a taxa de 
convergência de uma série de Fourier. Assim como na série do Capítulo 5, há sempre a questão 
da quantidade de trabalho analítico que queremos fazer e da quantidade de trabalho aritmético 
que queremos que o computador faça. À medida que os computadores ficam cada vez mais 
poderosos, o equilíbrio também está mudando progressivamente; nós estamos trabalhando menos, 


e os computadores, mais. 
14.4.15 Mostre que 


pode ser escrita como 
cos na 
n2(n + 1) 


Ha) = (2) a 2 
Nota: (x) e pa(x) são definidas nos exercícios precedentes. 


14.5 Fenômeno de Gibbs 


O fenômeno de Gibbs é um aumento excessivo momentâneo (overshoot), uma peculiaridade da série de Fourier e 
de outras séries de autofunção em uma descontinuidade simples. A Figura 14.1 mostra um exemplo. 
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Somatório de Série 
Na Seção 14.1 apresentamos um gráfico da soma dos primeiros termos da série de Fourier para uma onda em dente 
de serra (Figura 14.10). Agora, desenvolvemos métodos analíticos para fazer o somatório dos primeiros r termos 


de nossa série de Fourier. 
Pela Equação (14.19), 


1 T 
an cosna + bnsen ng = — f(t) cosn(t — x) dt. (14.69) 
TJ 
Então, a r-ésima soma parcial se torna!º 
sr(£) = > + 2 (ên cos ng + ba senna) 
= pl E FE) Hy 5 e“lon | dt (14.70) 
TJn 2 n=1 l l 


Fazendo o somatório da série finita de exponenciais (progressão geométrica)!! obtemos 


1 a (8) sen[(r + 5)(t — x)| 


=— dt. 14.71 
21 Ja sen4 (t — a) Á ) 


Sr(a) 


Essa série é convergente em todos os pontos, incluindo t = x. O fator 


sen[(r + i(t — x)|] 
2nsens(t — x) 


é o núcleo de Dirichlet mencionado na Seção 1.15 como uma distribuição delta de Dirac. 


Onda Quadrada 


Por conveniência de cálculo numérico, consideramos o comportamento da série de Fourier que representa a onda 
quadrada periódica 
; O<T<T, 


f(x) = s (14.72) 
2 


À —T<2<0. 


Essa é, em essência, a onda quadrada usada na Seção 14.3, e vemos imediatamente que a solução é 


2h (e sen3a | sen5a e) (14.73) 


A e E e 
Aplicando a Equação (14.71) à nossa onda quadrada (Equação (14.72)), temos a soma dos primeiros r termos 
(mais žao, que aqui é zero): 


h [7 sen|(r + D(t—a h f° sen|(r+ D(t—-x 
pose Ceia, 
47 Jo sens(t — x) 4T Jor  senj(t—s) 
h [7 sen|(r + }) (t-z h f”sen[(r+D(t+a 
Fi e a e iw 
47 Jo senz (t — x) AT Jo sen5(t + z) 
Esse último resultado se origina da transformação 
t-t 
na segunda integral. Substituindo t — x no primeiro termo por s e t + x no segundo termo por s, obtemos 
h [77 sen(r + Ł)s h [T+ sen(r + Ł)s 
Sr(a) = =) i 2) d | E, (14.75) 
AT Jr sen5s AT Jz senss 


10Há um certo interesse em observar que essa série também ocorre na análise da rede de difração (r fendas). 
Compare com o Exercício 6.1.7 com valor inicial n = 1. 
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Os intervalos de integração são mostrados na Figura 14.10 (parte superior). Como os integrandos têm a mesma 
forma matemática, as integrais de x to 7 — x são canceladas, deixando as faixas de integrais mostradas na parte 
inferior da Figura 14.10: 


je 14.76 
sete) 47 = senis i 


h ie sen(r + DS js h o sen(r + DS a 
Gi 2 


T 
ES sen5s 47 


E rrr 


EM O 


Figura 14.10: Intervalos de integração, Equação (14.75). 


Considere a soma parcial na vizinhança da descontinuidade em x = 0. A medida que x — 0, a segunda integral 
se torna desprezível e associamos a primeira integral com a descontinuidade em x = 0. Usando r + 5 = pe 


ps = é, obtemos 
= h f" seng d 
s eer en 


Cálculo de Overshoot 

Nossa soma parcial s,.(x) começa em zero quando z = 0 (de acordo com a Equação (14.22)) e aumenta até 
É = ps = 7, ponto em que o numerador, sené, fica negativo. Para r grande e, portanto, para p grande, nosso 
denominador permanece positivo. Obtemos o valor máximo da soma parcial tomando o limite superior pr = 7. É 
exatamente aqui que vemos que x, a localização do máximo overshoot, é inversamente proporcional ao número de 
termos considerados: 


Portanto, o valor máximo da soma parcial é 


_h 1 T sen EdE ah 2 T sen é 
Sr(máx = 5 T ep “O F E dE. (14.78) 


Em termos da integral de seno, si(x) da Seção 8.5, 


A E edge = 5 + si(m). (14.79) 


A integral é claramente maior do que 7/2, uma vez que ela pode ser escrita como 


gi T ~“ e) = [O É de, EE 


Vimos no Exemplo 7.1.4 que a integral de O oo é 7/2. Estamos subtraindo uma série de termos negativos dessa 
integral. Uma quadratura de Gauss ou uma expansão de série de potências e integração termo a termo resulta em 


92 eis 
F sen É Je = 1,1789797... (14.81) 
T Jo E 


o que significa que a série Fourier tende a apresentar um overshoot no canto positivo de cerca de 18% e um 
overshoot no canto negativo da mesma grandeza, como sugerido na Figura 14.11. A inclusão de mais termos 
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100 termos 
l S 80 60 40 20 termos 


0,1 0,02 0,04 0,06 0,08 10 + 


Figura 14.11: Onda quadrada — fenômeno de Gibbs. 


(aumentando r) nada faz para remover esse overshoot, mas limita-se a deslocá-lo para mais perto do ponto de 
descontinuidade. O overshoot é o fenômeno de Gibbs e por causa dele não se pode confiar na representação de 
série de Fourier para trabalho numérico de precisão, em especial na vizinhança de uma descontinuidade. 


O fenômeno de Gibbs não está limitado à série de Fourier. Ocorre também com outras expansões de autofunção. 


O Exercício 12.3.27 é um exemplo do fenômeno de Gibbs para uma série de Legendre. Para mais detalhes, veja 
Am. J. Phys. 60: 425 (1992). 


Exercícios 
14.5.1 Com as técnicas de somatório de soma parcial desta seção, mostre que em uma descontinuidade em 
f(x) a série de Fourier para f(x) assume a média aritmética dos limites da direita e da esquerda: 


F(xo) = =| f(xo + 0) + f(xo — 0)]. 


1 
2 
Ao avaliar lim, oo Sr(x0), talvez seja conveniente você identificar parte do integrando como uma 
função delta de Dirac. 


14.5.2 Determine a soma parcial, s,, da série na Equação (14.73) usando 


sen max 


(a) = a cos my dy, (b) 5 cos(2p — 1)y = 
m 0 p=1 


sen 2ny 


2sen y ` 


Você concorda com o resultado dado na Equação (14.79)? 


14.5.3 Avalie a série de função de degrau finita, Equação (14.73), h = 2, usando 100, 200, 300, 400 e 500 
termos para x = 0, 0000(0, 0005)0, 0200. Rascunhe seus resultados (cinco curvas) ou, se dispuser 
de uma rotina de montagem de gráficos, construa um gráfico com seus resultados. 


14.5.4 (a) Calcule o valor da integral do fenômeno de Gibbs 


r= [ tg 
VIE 0 t 


por quadratura numérica com precisão de 12 algarismos significativos. 
(b) Verifique seu resultado (1) expandindo o integrando como uma série, (2) integrando termo a 
termo e (3) avaliando a série integrada. Essa tarefa demanda cálculo de dupla precisão. 


Resposta: I = 1, 178979744472. 


14.6 Transformada Discreta de Fourier 


Para muitos físicos, a transformada de Fourier é automaticamente a transformada contínua de Fourier do Capítulo 
15. Contudo, a utilização de computadores digitais necessariamente substitui um contínuo de valores por um 
conjunto discreto; uma integração é substituída por um somatório. A transformada contínua de Fourier se torna a 
transformada discreta de Fourier e um tópico adequado para este capítulo. 
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Ortogonalidade em Pontos Discretos 


A ortogonalidade das funções trigonométricas e das exponenciais imaginárias é expressa nas Equações (14.15) 

a (14.18). Essa é a ortogonalidade usual para funções: integração de um produto de funções no intervalo de 

ortogonalidade. Os senos, co-senos e exponenciais imaginárias têm a notável propriedade de também serem 

ortogonais sobre uma série de pontos discretos a espaços iguais sobre o período (o intervalo de ortogonalidade). 
Considere um conjunto de 2N valores de tempo 


T 2T (2N — 1)T 


WUE O 5N (14.82) 
para o intervalo de tempo (0, T). Então, 
kT 
tp =" k=0,1,2,...,2N —1. 14. 
k 2N’ 0, b) ? ? ( 83) 


Provaremos que as funções exponenciais exp(2riptk/T) e exp(2riqtk/T) satisfazem uma relação de 
ortogonalidade sobre os pontos discretos tx: 


aa, 2miptr | 2migt 
Y [eo (2E) ep (2E) = 203p usann: (14.84) 


k=0 


Aqui, n, p e q são todos inteiros. 
Substituindo q — p por s, constatamos que o lado esquerdo da Equação (14.84) se torna 


se 2ristk sa 2risk 
exp T = 2 exp 3N |) 


k=0 


Constatamos que o lado esquerdo da Equação (14.83) se torna T. Essa é uma série geométrica finita com um termo 
inicial 1 e uma razão 
TiS 
r= exp| — ). 
NN 


1— r?N 


2N—1 5 

2 t pad 
5 ep( — +) O e Tei (14.85) 
k=0 2N, r=1, 


Pela Equação (5.3), 


estabelecendo a Equação (14.84), nossa relação de ortogonalidade básica. O valor superior, zero, é uma 
consegiiência de 

r2N -exp(2ris) = 1, 
para s inteiro. O valor mais baixo, 2N, para r = 1 corresponde a p = q. Deixamos a ortogonalidade das funções 
trigonométricas correspondentes para o Exercício 14.6.1. 


Transformada Discreta de Fourier 
Para simplificar a notação e fazer contato mais direto com a física, introduzimos o espaço w (recíproco), ou 
frequência angular, com 

2mp 
Wp = -P> 
Fazemos p se estender sobre os mesmos inteiros que k. A exponencial exp(+2ript/T) da Equação (14.84) se 
torna exp(Hiwptr). A opção de usar o sinal + ou o sinal — é uma questão de conveniência ou convenção. Em 
Mecânica Quântica escolhe-se o sinal negativo quando se estiver expressando a dependência temporal. 

Considere uma função de tempo definida (medida) nos valores discretos de tempo t;.. Então, construímos 


p=0,1,2,...,2N- 1. (14.86) 


2N—1 


NO get (14.87) 


k=0 


1 


F(wp) = 5N 
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Empregando a relação de ortogonalidade, obtemos 


p NS! 
do (eisrim )*eivopta = mk, (14.88) 
2N » 


e então, substituindo o índice m por k, constatamos que as amplitudes f(t) se tornam 


2N—1 
Ft) = X Flwpe torta, (14.89) 
p=0 
A função de tempo f(t), k = 0,1,2,...,2N — 1 e a função de fregiência F(w,),p = 0,1,2,...,2N — 1, são 
transformadas discretas de Fourier uma da outra.!? Compare as Equações (14.87) e (14.89) com as transformadas 
contínuas de Fourier correspondentes, Equações (15.22) e (15.23) do Capítulo 15. 


Limitações 
Consideradas como um par de relações matemáticas, as transformadas discretas de Fourier são exatas. Podemos 
dizer que os 2N vetores exp(—iwpty.), de 2N componentes, k = 0,1,2,...,2N — 1, formam um conjunto 


complexo!’ que abrange o espaço ty. Então, f(ty.) na Equação (14.89) é simplesmente uma combinação linear 
particular desses vetores. Como alternativa, podemos considerar que as 2N componentes medidas f(t) definem 
um vetor de 2N componentes no espaço tr. Então, a Equação (14.87) dá como resultado o vetor de 2N 
componentes F (wp) no espaço recíproco wp. As Equações (14.87) e (14.89) se tornam equações matriciais, sendo 
exp(iwpty)/(2N)!2 os elementos de uma matriz unitária. 

As limitações da transformada discreta de Fourier surgem quando aplicamos as Equações (14.87) e (14.89) 
a sistemas físicos e buscamos uma interpretação física e o limite F(w,) — F(w). O Exemplo 14.6.1 ilustra 
os problemas que podem ocorrer. A precaução mais importante a ser tomada para evitar problemas é tomar N 
suficientemente grande de modo a não haver nenhuma componente de fregiiência angular com uma freqiiência 
angular mais alta do que wy = 27N/T. Se o leitor quiser detalhes sobre erros e limitações na utilização da 
transformada discreta de Fourier, consulte Hamming em Leituras Adicionais. 


Exemplo 14.6.1 TRANSFORMADA DISCRETA DE FOURIER — ALIASING 
Considere o caso simples de T = 27, N = 2, e f (tk) = cos tp. Por 


kT kr 


t= =— k=0,1,2 14. 
k 4 2’ 0, , 3 ( 90) 


f(tk) = cos(ty) é representada pelo vetor de quatro componentes 
Ft) = (1,0, —1, 0). (14.91) 


As freqüências, wp, são dadas pela Equação (14.86): 


2mp 
Eee 14.92 
w= (14.92) 
Está claro que cos ty, implica uma componente p = 1 e nenhuma outra componente de freqüência. 
A matriz de transformação 
expliwptk)  exp(ipkt/2) 
2N 2N 
se torna 
1 1 1 1 
1/1 i 1 —i 
yli a 1 a (14.93) 
1 —i -1 ií 


Observe que a matriz 2N x 2N tem somente 2N componentes independentes. É a repetição de valores que torna 
possível a técnica da transformada rápida de Fourier. 


12 As duas equações de transformadas podem ser simetrizadas resultando (2N) -1/2 em cada equação, se desejado. 


13Pela Equação (14.85), esses vetores são ortogonais e, portanto, são linearmente independentes. 


“livro” — 2007/8/1 — 15:06 — page 694 — #704 


694 Física Matemática Arfken e Weber ELSEVIER 


Efetuando operações no vetor coluna f(t;.), constatamos que essa matriz resulta em um vetor coluna 
F(wp) = (0,5,0,5). (14.94) 
Aparentemente, há uma componente de frequência p = 3 presente. Reconstruímos f(t) pela Equação (14.89), 


obtendo 
fu eee, (14.95) 


Considerando partes reais, podemos reescrever a equação como 
RF(tk) = $ cos tk + 5 cos 3t. (14.96) 


É óbvio que esse resultado, Equação (14.96), não é idêntico ao nosso original f(tr) cost. Mas costą = 
> cos tk + > cos 3t at tk = 0,7/2,7; e 37/2. O costy e o cos3ty imitam um ao outro por causa do número 
limitado de pontos de dados (e da escolha particular de pontos de dados). Esse erro de uma freqüência imitando 
outra é conhecido como aliasing. O problema pode ser minimizado considerando mais pontos de dados. E 


Transformada Rápida de Fourier 

A transformada rápida de Fourier é um modo particular de fatorar e rearranjar os termos nas somas da transformada 
discreta de Fourier. Apresentada à comunidade científica por Cooley e Tukey,!4 sua importância está na drástica 
redução do número de operações numéricas requeridas. Por causa do tremendo ganho na velocidade conseguido 
(e redução de custo), a transformada rápida de Fourier foi festejada como um dos poucos avanços realmente 
significativos na análise numérica nas últimas décadas. 

Um cálculo direto de uma transformada discreta de Fourier para N valores de tempo (medidas) significaria N? 
multiplicações. Para N potência de 2, a técnica da transformada rápida de Fourier de Cooley e Tukey reduz o 
número de multiplicações requeridas a (N/2) log, N. Se N = 1.024 (= 210), a transformada rápida de Fourier 
consegue uma redução no processamento computacional de um fator de mais de 200. É por isso que a transformada 
rápida de Fourier é denominada rápida e é por isso que ela revolucionou o processamento digital de formas de 
ondas. Detalhes sobre a operação interna podem ser encontrados no artigo de Cooley e Tukey e no artigo de 
Bergland.!º 


Exercícios 
14.6.1 Derive as formas trigonométricas de ortogonalidade discreta correspondentes à Equação (14.84): 


ndo 2rpty Ingtk 
Em cos sen| —— | =0 
T T 


k=0 
2N—1 ; pfq 
2rpt 2rqt 
cos( mte) ( ete) =4 N, p=q*%0,N 
k=0 2N, p=q=0,N 
2N-1 0 pq 
2mpt 2rqt i 
sen( te) ( rate =4 N, p=q#0,N 
k=0 0, p=q=0,N 


Sugestão: Identidades trigonométricas como 
senA cos B = 4 [sen(A+ B) + sen(A — B)] 
são úteis. 
14.6.2 A Equação (14.84) exibe ortogonalidade somando sobre pontos de tempo. Mostre que temos a 
mesma ortogonalidade somando sobre pontos de fregiiência 


2N—1 
: ao 
(e) e'vptk = mk- 


1 


2N 
p=0 


147, W. Cooley e J. W. Tukey, Math. Comput. 19: 297 (1965). 

5G. D. Bergland, A guided tour of the fast Fourier transform, IEEE Spectrum, julho, p. 41-52 (1969); veja também W. H. Press, 
B. P. Flannery, S. A. Teukolsky, e W. T. Vetterling, Numerical Recipes, 2 ed., Cambridge, UK: Cambridge University Press (1996), Seção 
12.3. 
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14.6.3 Mostre, com detalhes, como ir de 


1 2N—1 
= iwptk 
F(wp) = 3N 5 J (te)er 
k=0 
para 
2N—1 
Ft) = fuer, 
p=0 


14.6.4 As funções f(t) e F (wp) são transformadas discretas de Fourier uma da outra. Derive as seguintes 
relações de simetria: 


(a) Se f (tx) for real, F (wp) é simétrica hermitiana, isto é, 
[4T N 
(b) Se f(t) for imaginária pura, 
[4T N 


Nota: A simetria da parte (a) é uma ilustração do aliasing. A freqüência 4n N/T — wp se disfarça 
como a freqüência wp. 


14.6.5 Dados N = 2, T = 2r e f (tk) = sent, 
(a) ache F(wp), p = 0,1,2,3, e 
(b) reconstrua f (tx) a partir de F (wp) e exiba o aliasing de w1 = 1 e w3 = 3. 
RESP. (a) F (wp) = (0, i/2,0, —i/2) 
(b) f(tk) = isen ty — isen 3t. 


14.6.6 Mostre que os polinômios de Chebyshev Tm (a) satisfazem uma relação de ortogonalidade discreta 


1 N-1 1 0, mn 
=Tm(—1)Ta(—1) + 5 Tm(£s)Tnl(£s) + =Tm(1)Tn(1) =4 N/2, m=n+0 
? sml E N, m=n=0. 


Aqui, £s = cos s, em que os (N + 1)8, são igualmente espaçados ao longo do eixo 6: 


fio  s=0,1,2..., N. 
N 


14.7 Expansão de Fourier de Funções de Mathieu 


Como aplicação realista de séries de Fourier, agora derivamos, em primeiro lugar, equações integrais satisfeitas 
por funções de Mathieu, das quais, na seqüência, são obtidas séries de Fourier. 


Equações Integrais e Série de Fourier para Funções de Mathieu 
Nosso primeiro objetivo é estabelecer equações integrais de Whittaker que as funções de Mathieu satisfaçam, das 
quais obtemos então suas representações de série de Fourier. Começamos com uma representação integral 


V(r) = f(z + ixcos0 + iysen 0,0) do (14.97) 


=F 


de uma solução V da equação de Laplace com uma função diferenciável duas vezes f(v, 0). Aplicando VºaV, 
verificamos que ela obedece à EDP de Laplace. Separar variáveis na EDP de Laplace sugere escolher as forma de 
produto f(v,0) = e*" (0). Substituindo as variáveis elípticas da Equação (13.163), escrevemos V como 


R(£) Dm) e” = laje tie cosh £ cos n cos 0+icsenh sen nsen 0) do (14.98) 


hei” É 
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com normalização R(0) = 1. Visto que é e m são variáveis independentes, podemos fazer é = 0, o que leva à 
representação integral de Whittaker 


(n) = i o(0) exp (ick cos 6 cos n) d0, (14.99) 


em que ck = 2,/q pela Equação (13.180). Está claro que & é par na variável ņ e periódica com período 7. Para 
provar que q ~ &, verificamos como ¢(0) é restringida quando admitimos que &(n) obedece à EDO angular de 
Mathieu 

d'O 

“5 + (A — 2q cos 2n)B(m) 

dn 

= (0) exp(ick cos 0 cos n) 
- [A — 2q cos 2m + (ick cos Osen n)? — ick cos 0 cos n| do. (14.100) 


Aqui integramos o último termo do lado direito por partes, obtendo 


2 
e + (A — 2q cos 27) P(m) 
= d(0)(—ick cos nsen 0) exp(ick cos O cos n) j 


o(0) exp (ick cos 8 cos n) [A — 2q cos 2n — ick cos O cos n] do 


=F 


dE / [=6'(9)(—ick cos nsen 0) + A(0)ick cos n cos 0] exp (ick cos 8 cos n) do 
= exp ick cos 6 cos m [H(0)(A — 2q cos 2n) + é (O)ick cos nsen] do, (14.101) 


em que o termo integrado desaparece se Q(—7) = (7r), o que admitimos ser o caso. Integrar mais uma vez por 
partes resulta em 


do T 
PE + (A — 2q cos 2n)® (n) = —¢' (0) exp ick cos O cos n a 
+ / exp (ick cos 8 cos n) [4(0)(A — 2q cos 2m) + 4"(0)] do, (14.102) 


onde o termo integrado desaparece se q! for periódica com período 7, o que admitimos ser o caso. Por conseguinte, 
se &(8) obedece à EDO angular de Mathieu EDO, o mesmo acontece com a integral &(7), na Equação (14.99). 
Por consegiiência, (0) ~ (0), onde a constante pode ser uma função do parâmetro q. 

Assim, temos o resultado principal: uma solução 9(m) da EDO de Mathieu que é par na variável satisfaz a 
equação integral 


(n) = An(g) / e?it va cos 0 cos nd(g) dg. (14.103) 


Quando essas funções de Mathieu são expandidas em uma série de Fourier de co-seno e normalizadas de modo 
que o termo principal é cos nn, elas são denotadas por cen (n, q). 

De modo semelhante, soluções da EDO de Mathieu que são ímpares em n com termo principal sen nm em uma 
série de Fourier são denotadas por sen (1, q) e, do mesmo modo, pode-se demonstrar que elas obedecem à equação 
integral 


T 


sen (n, q) = s0 [ sen (2i,/qsennsend) sen (0, q) do. (14.104) 


= 
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Agora chegamos à expansão de Fourier para as funções angulares de Mathieu e começamos com 
se1ı (7, q) = sen n + 2 B (g)sen(2v + 1), 8 -È 8 q! (14.105) 


como um paradigma para a construção sistemática de funções de Mathieu de paridade ímpar. Observe que o ponto 
principal, isto é, o coeficiente 8, de sen(2v + 1)n na série de Fourier, depende do parâmetro q e é expandido em 
uma série de potências. Além do mais, se, é normalizada de modo que o coeficiente do termo principal, sen n, é a 
unidade, isto é, é independente de q. Essa característica se tornará importante quando se; for substituída na ODE 
angular de Mathieu para determinar o autovalor A(q). 

O fato de que a série de potências 5, em q começa com expoente v pode ser provado por uma série mais 
simples, porém semelhante, para ses (1, q): 


se1(1,q -Pal Bent PSS (14.106) 


que é útil somente para essa demonstração. Contudo, visto que precisamos expandir 


sen?” tiy = 5 Bymsen(2m + 1) (14.107) 
m=0 
com coeficientes de Fourier 
1/7 —1)” /2 1 
Bom = Ifs en?” +insen(2m + Dn dn = EOT A (14.108) 
TJ Ze v—m 


que podemos procurar em uma tabela de integrais (veja Gradshteyn e Ryzhik em Leituras Adicionais do Capítulo 
13), essa prova nos dá uma oportunidade de introduzir os Bym que são não-zero somente se m < v e são elementos 
importantes das relações de recursão para os termos principais de se, (e todas as outras funções de Mathieu de 
paridade ímpar). Substituindo a Equação (14.107) na Equação (14.106), obtemos 


ses(m,q Es 5 Bomy (q)sen(2m + 1)n. (14.109) 
v=0 m=0 


Comparando essa expressão para se; com a Equação (14.105), encontramos 


= X BmuYmla). (14.110) 


Aqui, a soma começa com m = v porque B,,, = O para m < v. 
Em seguida, substituímos a Equação (14.106) na equação integral, Equação (14.104), para n = 1, em que 
inserimos a série de potências para sen(2i,/gsen msen 0). Isso resulta em 


E 1 T 
et ao L, sen(2i,/qsen nsen 0)seı(0, q) do 


> Ymlg)sen?™ tin 


= o 
= ivq 5 E — E ; gen t2mt29 dø, 
dai (14.111) 
da qual obtemos as relações de recursão 
Yml) = — Bam! mi /qsılq > Yu(g of s en?” t?m+29 do, (14.112) 
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2m-+1 m 


ao compararmos os coeficientes de sen n. Isso mostra que a série de potências para y, (q) começa com q 
Usar a Equação (14.110) prova que a série de potências para 8, (q) também começa com q”, e isso confirma a 
Equação (14.105). A integral na equação (14.112) pode ser avaliada analiticamente e expressa por meio da função 
beta (Capítulo 8) em termos de razões de fatoriais, mas aqui não precisamos dessa fórmula. Nosso próximo objetivo 
é estabelecer uma relação de recursão para o termo principal Bt) de se;, na Equação (14.105). Substituímos 
a Equação (14.105) na equação integral, Equação (14.104), para n = 1, onde novamente inserimos a série de 
potências para sen(2i,/qsen sen 0) juntamente com a expansão 


= 5 amq” t12., (14.113) 


Ti m=0 


Aqui, o fator extra, 1,/q, cancela o fator correspondente do seno na equação integral, o que resulta em 


So g2v+1 1 T 
> 6 qt sen t'y =) sen?” t2A +20 do 
T 


(2v +1)! 27 
> amg” t BW) sen(2v + 1)n. (14.114) 
m,u=0 


Aqui, substituímos sen2/+! por sen(2m + 1)ņ usando a Equação (14.107). Comparando os coeficientes de 


q" sen(2v + Dn, para N = u + v, obtemos a relação de recursão 


N N-v N-n (n) 
Bun Bra = MON a 14.115 
D D Rugtas D a 


Agora substituímos a Equação (14.108) para obter a relação de recursão principal para os coeficientes principais 
B®? para se1: 
N N- N-n 
Bs) Nov 2v +1\/2v +1 (n) 
= = f 14.116 
o 22 (20 +) \v-nj\ v-à que Bm ( ) 


Exemplo 14.7.1 COEFICIENTES PRINCIPAIS DE se; 


Avaliamos a Equação (14.116) começando com N = 0,n = 0. Para esse caso, achamos B® = aop ou Qo = 1 
porque o coeficiente de sen n em ses, B® = 1, por normalização. Para N = 1, n = 0, a Equação (14.116) resulta 


em 
MPP OPA] aum 


em que BP = 0e B® é descartado, uma característica geral. Claro que (0) = ( porque sen ņn em se; tem 
coeficiente unitário, o que resulta em q; = 3/8. 
O caso N = 1, n = 1 resulta em 
—1 /3 3 
BOL- veis 
ou B® = —1/8. O termo principal é obtido do caso geral n = N, 
(=1)N 2N +1\ «oy/2N +1 (N) 
22N(2N + 1)! 0 Bo N = 000 n > (14.119) 


como 


mo (GD (2N41 
No 2NONADA N )P (14.120) 
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que foi derivado pela primeira vez por Mathieu. Para N = 1 essa fórmula reproduz nosso resultado anterior, 
B® = —1/8. E 


Para determinar o primeiro termo não-principal ago de se;, Equação (14.105), e o autovalor A(q) 
substituímos se; na EDO angular de Mathieu, Equação (13.181), usando as identidades trigonométricas 


2 cos 2msen(2v + 1)m = sen(2v + 3)n + sen(2v — Dn 


2 2 1 
d’sen(2v + 1)n = —(2v + 1)2sen(2v + Dn. 


dn? 
Isso resulta em 
dºse; 
0 = dr? + (Ay — 2q cos 2n)sey = qg(senm — sen3n) + Aysenm — senn 
Da - (2v + 1)°] A + 880 gT +- |sen(2v + 1)n 
— 22vpl(v + 1)! Ra 


q 3 es Di + Brg +... | (sen(2v + 3)m + sen(2v ip 1)n) 


= (^ l1+q a| em + 8? + 24 e |) sem 


+ sen3n [-a- (a + Bq | + (A = (= 2291 + BSD é)) 


+ sen(2v + Dn[Ay — (2v + 1)°] (mi + 6a) 


222 y!(v + 
oi t (+) qua? 
— qsen(2v + Dolo D+ Pala 
— qsen (2v + 1)n (~q) BD” +... Gio 
220-1) (y — lv! á l | 


Nessa série os coeficientes de cada potência de q dentro de diferentes termos de seno devem se anular; como o de 
senm é zero, temos como resultado o autovalor 


1 
Mg) =1-0- + 6D +, (14.122) 


com BP = 1/26 vindo do coeficiente que se anula de q? em sen3n. Igualar o coeficiente de (—q)” em sen(2v+1)n 
a zero resulta na identidade 


1 1 
27 A(v +1)! 2W-D(y— Dil i 


[1— (2v + 1)°] (14.123) 


que verifica a determinação correta dos termos principais pe) na Equação (14.120). O coeficiente que desaparece 
de q”+! em sen(2v + 1)n resulta em 

cy 

22vyl(v +1)! 


+ [1 -= (2v +1) -8 =0, (14.124) 


o que implica a principal relação de recursão para coeficientes não-principais, 


v v— (—1)7+1 
4v(v + DB, = -607d + Fono (14.125) 
para os primeiros termos não-principais. Verificamos que 
w) q (=1)"+Hp 
Bia E q2+2(y + 1)!2 (14.126) 
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satisfaz essa relação de recursão. Termos de ordem mais alta não dominantes podem ser obtidos igualando o 
coeficiente de q”*2, etc. No geral, derivamos a série de Fourier para 


ses (17, q) = senn + 3 RE - sen(2v + 1) 
GRC CA vp + 1)! 227+2(y + 1)! y 
v=1 


(14.127) 


Um tratamento similar resulta nas séries de Fourier para se2n+1(n,q) e seon(n, q). Uma invariância da EDO de 
Mathieu leva à relação de simetria 


ce2n+1(7, q) = (—1)”se2n+1 (7 5 n/2, —q), (14.128) 


que nos permite determinar a Cezn+1 de período 27 por Sezn+ı. De modo semelhante, ce2n(N + 7/2, —q) = 
sean (n, q) relaciona essas funções de Mathieu de período 7 uma à outra. Por fim, fazemos um breve rascunho de 
uma derivação da série de Fourier para 


ceo(ma)=1+> Aalgcos2mm, Bala) = X Pa, (14.129) 


n=1 


como um paradigma para as funções de Mathieu de período m. Observe que essa normalização está de acordo 
com Whittaker e Watson e com Hochstadt em Leituras Adicionais do Capítulo 13, ao passo que em AMS-55 (a 
referência completa é dada na nota de rodapé 4 no Capítulo 5) ceo difere por um fator de 1/2. A relação de 
simetria pela EDO de Mathieu, 


ceo G = -a = ceo(7, 4), (14.130) 
implica 
Bal>a) = (=1)" bn (a); (14.131) 


isto é, 35, contém somente potências pares de q e Banı Somente potências ímpares. 
O fato de que a série de potências para 8, (q) na Equação (14.129) começa com q” pode ser provado pela 
expansão similar 


ceo(m,9) = X Yala) cos” n, yala) = X 1a", (14.132) 
n=0 u=0 


como para se; nas Equações (14.105) a (14.112). Substituindo a Equação (14.132) na equação integral 


ceo(m, q) = colq) / eiva cost cos nce(g, q) do, (14.133) 


=R. 


inserindo a série de potências para a função exponencial (descartando potências ímpares cos?™+1 


os coeficientes de cos?” n, temos como resultado 


0 e igualando 


2m Œ 
m 2 


Ym(9) = ci(g)(—a) Em ZO cos?™t2H g do. (14.134) 
ea No 


Essa relação de recursão mostra que a série de potências para y, (q) começa com q”. Expandimos 


cos?” n= 3 Anm cos 2mn (14.135) 
m=0 
com coeficientes de Fourier 
2 [7/2 1 2 
Ans zJ cos?” n cos 2mn dn = se E E (14.136) 
T J-r/2 22 Lin Ea A) 
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que são não-zero somente quando m < n. Usando esse resultado para substituir potências de co-seno na 
Equação (14.132) por cos 2mn, obtemos 


Bald) = XO Ano: (14.137) 


o que confirma a Equação (14.129). 
Prosseguindo como para se; nas Equações (14.113) a (14.120), substituímos a Equação (14.129) na integral, 
Equação (14.133), e obtemos 


oO 92m m 
m +m 
> 1) Eri! XC Amy cos(2vn) Ama 
m,u,v,;A=0 v=0 
= XO Omp gt cos(2vn), (14.138) 
m,u,v=0 
com 
2 so ug (14.139) 
ri Am . . 
27c (q) a 


Comparando o coeficiente de q" cos(2vn) com N = m + u, extraímos a relação de recursão para coeficientes 
principais 3/7 de ceo 


N m N 
92m x 
DCD" a tm Di A Do oras (14.140) 
` A=0 


m=v m=0 


com Anm na Equação (14.136). 


Exemplo 14.7.2 COEFICIENTES PRINCIPAIS PARA ceg 
O caso N = 0, v = 0 da Equação (14.140) resulta em 


ABS? = aobo, (14.141) 


com Aoo = 1 e BO = 1 pela normalização do termo principal de ceo para unidade, de modo que resulta aq = 1. 
O caso N = 1, v = 0 resulta em 


Ago BP? Ago — 2410 [89 Aio + BP Au] = TEA + app, (14.142) 


com BP = 0 pela Equação (14.129). Isso é simplificado para 


1 
(0) o 580” Es on 86) ds B®, (14.143) 
em que B® é descartado. Já sabemos que B® = Q0 pelo termo principal unitário de ceo. Por conseguinte, 
Qı = —1/2. 
Para o caso de N = 1, v = 1, obtemos 
24180 Aro = 0988, (14.144) 
com A10 = 1/2 = Ay, do qual resulta B® = —1/2. Para o caso N = 2, v = 2, encontramos 
24 
ES © 430 = ab, (14.145) 


com Avo = 3/8, do qual resulta BP = 274 , O caso geral N,v = N resulta em 


ERR aa na 
(—1) EN NNBo Ano = Qo0bN (14.146) 
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com Ayy = 272N+, Ano = sw ERO da qual resulta o termo principal 


CD BM CI 
Bi = 2N-1(2N)! CS) = 92N- INB (RENI 


E 
Os termos não-principais A de ceo são mais bem determinados pela EDO angular de Mathieu por 
substituição da Equação (14.129), por analogia com se;, Equações (14.121) a (14.127). Usando as identidades 


2 cos(2nm) cos 27 = cos(2n + 2)n + cos(2n — 2)n, 
2 


E cos(2nn) = — (2n)? cos(2nn), (14.148) 
n 
obtemos 


d?ceo 


Pe + (Ao(q) — 2q cos 2n) ceo = 0 


7 
= o(d) -a(-; + zË) Jri 


pa Ao — 4n?) ) cos(2nn) Es + Bear 


(n) 
0 aep eht] 


x [cos(2n + 2)n + cos(2n — 2)n). (14.149) 


Igualando o coeficiente de cos(2n7) n = 0 a zero temos como resultado o autovalor 


1 
Ao = =g? + 


7 
TERMER (14.150) 


2 


O coeficiente de cos(2nn)q” dá como resultado uma identidade, 


4n? (1 
n-+1 = 
(ANET imema T Pasa e SO (INIST) 


que mostra que o termo principal na Equação (14.147) foi corretamente determinado. O coeficiente de 


q"*2 cos(2nn) resulta na relação de recursão 
n n— —1 nEkI —1 4 
Ana 5 Bla + = + fi =0. (14.152) 


92nn12 22n+ (mn + D!2 
É correto verificar que 


n(3n + 4) 
22n+3(n + D!2 


Ba = (1)! (14.153) 


satisfaz essa relação de recursão. No geral, derivamos a fórmula 


1 7 
ceo(n,q) = 1+eos2n|-30 + z+ | 
2 $ 
+ cosan + | + cosbu| sis +] 
a (~a) (D Hn(3n + 4)g t? 
= 1+ J cos(2nn) | is I3 (n + DB Iersel? 


n=1 


(14.154) 
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De modo semelhante, podemos derivar 


ces(n,q) = cosn + 5 cos(2n + 1)n 


(=9)" | s 
= 22nn!(n +1)!  22n+2(n + 1)1? f 
(14.155) 
cujo autovalor é dado pela séries de potências 
àQ =1+ E 34 (14.156) 
1a) =1 +g- 3T- zl . : 


Figura 14.12: Funções Angulares de Mathieu. (De Gutiérrez-Vega et al., Am. J. Phys. 71: 233 (2003).) 


Exercícios 


14.7.1 Determine os coeficientes não-principais p0, para sej. Derive a relação de recursão cor- 
respondente. 


14.7.2 Determine os coeficientes não-principais beta pro, para ceo. Derive a relação de recursão 
correspondente. 


14.7.3 Derive a fórmula para ce,, Equação (14.155), e seu autovalor, Equação (14.156). 
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Transformadas Integrais 


15.1 Transformadas Integrais 
Na Física Matemática frequentemente encontramos pares de funções relacionadas por uma expressão da forma 


b 
sta) = f HOK(a,t) dt. (15.1) 


A função g(a) é denominada transformada (integral) de f (t) pelo núcleo K(a,t). A operação também pode 
ser descrita como o mapeamento de uma função f(t) no espaço t para uma outra função, g(a), no espaço a. 
Essa interpretação adquire significância física na relação tempo-frequiência de transformadas de Fourier, como no 
Exemplo 15.3.1, e nas relações espaço real-espaço momentum da Física Quântica da Seção 15.6. 


Transformada de Fourier 
Uma das mais úteis entre o número infinito de possíveis transformadas é a transformada de Fourier, dada por 


1 E iwt 
glw) = Ss Fe dt. (15.2) 


Duas modificações dessa forma, desenvolvidas na Seção 15.3, são as transformadas de Fourier de co-seno e as 


transformadas de Fourier de seno: 
2 D0 
Gelw) = 14/— f(t) coswt dt, (15.3) 
T Jo 


gsw) = o f(t)sen wt dt. (15.4) 


A transformada de Fourier é baseada no núcleo e'“* e suas partes real e imaginária tomadas separadamente, cos wt 
e sen wt. Como esses núcleos são as funções usadas para descrever ondas, as transformadas de Fourier aparecem 
com fregiiência em estudos de ondas e na extração de informações de ondas, em particular quando estão envolvidas 
informações de fase. A leitura de um interferômetro estelar, por exemplo, envolve uma transformada de Fourier 
do brilho em um disco estelar. A distribuição de elétrons em um átomo pode ser obtida de uma transformada de 
Fourier da amplitude de raios X espalhados. Na Mecânica Quântica, a origem física das relações de Fourier da 
Seção 15.6 é a natureza ondulatória da matéria e a descrição que fazemos da matéria em termos de ondas. 


Exemplo 15.1.1 TRANSFORMADA DE FOURIER DA GAUSSIANA 


. aê P es 
A transformada de Fourier de uma função gaussiana e7% * , 


1 e ; 
g(w) = a eTA Ë ewt dt, 


pode ser feita analiticamente completando o quadrado no expoente, 


$ 2 2 
2,2 Ly 2 od a 
— qt? + iwt = —a”| t 
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o que verificamos avaliando o quadrado. Substituindo essa identidade, obtemos 


1 oO 
glw) = ge] ent dt, 


deslocando a variável de integração t — t + 5%. Isso é justificado por uma aplicação do teorema de Cauchy 
ao retângulo com vértices —-T, T, T + 34, -T + 3% para T — oo, observando que o integrando não tem 
nenhuma singularidade nessa região e que as integrais sobre os lados, de +T a +T + 547, se tornam desprezíveis 


para T — œ. Por fim, reescalonamos a variável de integração como é = at na integral (veja as Equações ((8.6) e 


(8.8)): 
o e dt F E E 


—oo a 


Substituindo esses resultados, encontramos 


ii 1 w? 
g(w) = —=exp| —— 
av'2 4a2 J’ 
mais uma vez uma gaussiana, mas em um espaço w. Quanto maior for a, isto é, quanto mais estreita for a gaussiana 


e “2 Ê : i EE 
original e~% t, mais larga será sua transformada de Fourier ~ e7% /4", E 


Transformadas de Laplace, Mellin e Hankel 
Três outros núcleos úteis são 


Er tJn(at), RA 
Esses núcleos dão origem às seguintes transformadas 

g(a) = a fede, Transformada de Laplace (15.5) 
0 

g(a) = Í E S(WtJnlat) dt, Transformada de Hankel (Fourier-Bessel) (15.6) 
0 

g(a) = o. Dt dt; Transformada de Mellin. (15.7) 
0 


Claro que os tipos possíveis são ilimitados. Essas transformadas são úteis na análise matemática e em aplicações 
físicas. Na verdade, já usamos a transformada de Mellin sem chamá-la por seu nome, isto é, g(a) = (a — 1)! é 
a transformada de Mellin de f(t) = e™*. Veja E. C. Titchmarsh, Introduction to the Theory of Fourier Integrals, 
2% ed., Nova York: Oxford University Press (1937), para mais transformadas de Mellin. É claro que também 
poderíamos dizer que g(a) = n!/a”+! é a transformada de Laplace de f(t) = t”. Das três, a transformada de 
Laplace é, de longe, a mais usada e será discutida minuciosamente nas Seções 15.8 a 15.12. A transformada de 
Hankel, uma transformada de Fourier para uma expansão de função de Bessel, representa um caso-limite de uma 
série de Fourier-Bessel. Ela ocorre em problemas de potencial em coordenadas cilíndricas e é muito aplicada em 
acústica. 


Linearidade 


Todas essas transformadas integrais são lineares, isto é, 
b 
f [cı fi(t) + c2 f2(t)] K (a, t) dt 
b b 
= a f filt) K (a, t) dte f f(DK(a,t) dt, (15.8) 
b 


b 
/ cf(t)K(a, t) dt = ef HOKt(a,t) dt, (15.9) 


em que c; e co são constantes e fi(t) e fo(t) são funções para as quais a operação transformada é definida. 
Representando nossa transformada integral linear pelo operador £, obtemos 


gla) = Lf(t). (15.10) 
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Esperamos que exista um operador inverso L7 t, tal que! 


ft) = L g(a). (15.11) 


No caso de nossas três transformadas de Fourier, L”! é dado na Seção 15.3. Em geral, a determinação da 
transformada inversa é o principal problema da utilização de transformadas integrais. A transformada inversa de 
Laplace é discutida na Seção 15.12. Se o leitor quiser detalhes sobre as transformadas inversas de Hankel e Mellin, 
consulte as Leituras Adicionais no final do capítulo. 


Solução relativamente fácil 


Problema no Solução no espaço 


espaço da transformada a da transformada 
Transformada Transformada 
integral inversa 
Problema Solução difícil Solução do 
..........———— — > ...—— — 


original problema original 


Figura 15.1: Esquema para transformadas integrais. 


Transformadas integrais têm muitas aplicações e interpretações físicas especiais que serão observadas no 
restante deste capítulo. A aplicação mais comum está esquematizada na Figura 15.1. Há problemas que são 
difíceis de resolver (se é que podem ser resolvidos) nas coordenadas originais (espaço original), mas cuja 
transformada pode ser resolvida com relativa facilidade. Nesses casos a transformada inversa transporta a solução 


das coordenadas transformadas para o sistema original. O Exemplo 15.4.1 e o Exercício 15.4.1 ilustram essa 
técnica. 


Exercícios 
15.1.1 As transformadas de Fourier para uma função de duas variáveis são 


1 (& : 
F(u,v) = =| PRI aja da dy, 
27 -Joo 
1 [O 
f(x,y) = =) J ruyet du dv. 
27 Joy 
Usando f(x, y) = f([x2 + y?]!/2), mostre que as transformadas de Hankel de ordem zero 
Flo) = | rE) dr 
0 


fo) = f OFr) do. 
0 
são um caso especial das transformadas de Fourier. 


Essa técnica pode ser generalizada para derivar as transformadas de Hankel de ordem v = 


0, > 1, > . . . (compare com I. N. Sneddon, Fourier Transforms, Nova York: McGraw-Hill (1951)). 


Uma abordagem mais geral, válida para v > —> é apresentada em Sneddon, The Use of Integral 
Transforms (Nova York: McGraw-Hill (1972)). Poderíamos também observar que as transformadas 


de Hankel de ordem não-inteira v = +5 se reduzem a transformadas de Fourier de seno e co-seno. 


"Expectativa não é prova e, aqui, a prova da existência é complicada porque, na verdade, estamos em um espaço de Hilbert de número 
infinito de dimensões. Provaremos a existência nos casos especiais de interesse por construção propriamente dita. 
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15.1.2 


15.1.3 


15.1.4 


Admitindo a validade do par de equações transformada de Hankel-transformada inversa de Hankel 


o= f HD Jnlat)t dt, 


f(t) = e g(o)Jn(at)a da, 


mostre que a função delta de Dirac tem uma representação integral de Bessel 


dt—t) = fo Jn(at) Jn(ata da. 
0 


Essa expressão é útil para desenvolver funções de Green em coordenadas cilíndricas, em que as 
autofunções são funções de Bessel. 


Pelas transformadas de Fourier, Equações (15.22) e (15.23), mostre que a transformação 


ts Ing 


tw > qq 


leva a 


2mi Ju-ico 


y+ico 
F(x) = =), Gla) “da. 


Essas expressões são as transformadas de Mellin. Uma troca similar de variáveis é empregada na 
Seção 15.12 para derivar a transformada inversa de Laplace. 


Verifique as seguintes transformadas de Mellin: 


of xr% tsen (kz) de = k “(a 1)!sen 7s, I<a<l. 


UNA x°! cos(kx) de = k” “(a — 1)! cos, 0<a<l. 


Sugestão: Você pode forçar as integrais a uma forma tratável inserindo um fator de convergência 
ez e (após integração) fazendo b — 0. Além disso, cos kx + isen kx = expikz. 


15.2 Desenvolvimento da Integral de Fourier 
No Capítulo 14 mostramos que séries de Fourier são úteis para representar certas funções (1) em um intervalo 
limitado [0, 27], [- L, L], e assim por diante, ou (2) para o intervalo infinito (—c0, 00), se a função for periódica. 
Agora, voltamos nossa atenção para o problema de representar uma função não-periódica em uma faixa infinita. 
Em termos físicos isso significa resolver um pulso único ou pacote de ondas em ondas senoidais. 

Já vimos (Seção 14.2) que, para o intervalo |- L, L], os coeficientes a, e bn podiam ser escritos como 


L 
= zS f(t) cos Mat, (15.12) 
=E 


S t 
1, Osen dt. (15.13) 
—L 


A série de Fourier resultante é 


ps NTE nrt 
a 5 sen—— io f(t)sen dt, (15.14) 
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ou 
1 R E pe nT 
f(x) = Tl, f(t) dt+ P Ff(t) cos (t — x) dt. (15.15) 


Agora deixamos que o parâmetro L se aproxime de infinito, transformando o intervalo finito [—L, L] no intervalo 
infinito (—o0, 00). Fazemos 


EE es T = Aw, com L — 00. 
L L 
Então, temos 
LO RE 
TORTOJ aw [ Ff(t) cos w(t — x) dt, (15.16) 
m n=1 eo 
ou a E 
fla) = F do f f(t) cosw(t — x) dt, (15.17) 
T Jo —0o0 


substituindo a soma infinita pela integral sobre w. O primeiro termo (correspondente a ao) se anulou, admitindo-se 
que [2 f(t) dt existe. 

É preciso salientar que esse resultado (Equação (15.17)) é puramente formal. Não pretende ser uma derivação 
rigorosa, mas pode se tornar rigorosa (compare com I. N. Sneddon, Fourier Transforms, Seção 3.2). Consideramos 
a Equação (15.17) a integral de Fourier. Ela está sujeita às condições de que f(x) é (1) contínua parte por parte, 
(2) diferenciável parte por parte e (3) absolutamente integrável, isto é, f as |f (x)| dz é finita. 


Integral de Fourier — Forma Exponencial 


Nossa integral de Fourier (Equação (15.17) pode ser colocada em forma exponencial, observando que 


f£) = =). dw i f(t) cosw(t — x) dt, (15.18) 
enquanto 
— dao f F(t)senw(t — x) dt = 0; (15.19) 


cos w(t — x) é uma função par de w e sen w(t — x) é uma função ímpar de w. Somando as Equações (15.18) (15.19) 
(com um fator i), obtemos o teorema integral de Fourier 


f(x) : a o do f Fte“! dt. (15.20) 


=j 


A variável w introduzida aqui é uma variável matemática aleatória. Em muitos problemas físicos, entretanto, 
ela corresponde à freqüência angular w. Então podemos interpretar a Equação (15.18) ou (15.20) como uma 
representação de f(x) em termos de uma distribuição de trens de onda senoidais infinitamente longos de freqüência 
angular w, nos quais a freqüência é uma variável contínua. 


Derivação da Função Delta de Dirac 
Se a ordem de integração da Equação (15.20) for invertida, podemos reescrevê-la como 


f(x) = a HO E e stc do dt. (15.204) 


Aparentemente, a quantidade entre colchetes se comporta como uma função ó(t — x). Poderíamos considerar que 
a Equação (15.20) nos dá uma representação da função delta de Dirac. Como alternativa, nós a consideramos uma 
pista para uma nova derivação do teorema integral de Fourier. 

Pela Equação ((1.171b) (deslocando a singularidade de t = 0 to t = x), 


f(x) = lim j fO Snt — x)dt, (15.21a) 


— 00 
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em que ôn(t — x) é uma segiiência que define a distribuição (t — x). Note que a Equação (15.21a) admite que 
f(t) é contínua em t = x. Consideramos que ôn (t — x) é 


sen n(t — x) 1 f” iwa) 
agja = iwlt-a2) dw, 15.21b 
Ando) m(t— a) e e a Rodo) 


=n 


usando a Equação (1.174). Substituindo na Equação (15.21a), temos 


1 oO n F 
f(x) = lim — / fA J vt) dw dt. (15.210) 
Permutando a ordem de integração e então considerando o limite quando n — oo, temos a Equação (15.20), o 
teorema integral de Fourier. 

Entendendo que ele deve ter à frente um sinal de integral, como na Equação (15.21a), a identificação 


TA 
i-a) =z | ett) dw (15.21d) 


fornece uma representação muito útil da função delta. 


15.3 Transformadas de Fourier — Teorema da Inversão 
Vamos definir g(w), a transformada de Fourier da função f(t), por 


== 1 i iwt 
g(w) = a Fel dt. (15.22) 


Transformada Exponencial 
Então, pela Equação (15.20), temos a relação inversa, 


fe =|. glw)e™™* dw. (15.23) 


Note que as Equações (15.22) e (15.23) são quase, mas não exatamente, simétricas, diferindo no sinal de t. 

Aqui há dois pontos que merecem comentário. Primeiro, a simetria 1/27 é uma questão de opção e não 
de necessidade. Muitos autores anexarão todo o fator 1/27 da Equação (15.20) a uma das duas equações: 
Equação (15.22) ou Equação (15.23). Segundo, embora a integral de Fourier, Equação (15.20), tenha sido alvo 
de muita atenção na literatura matemática, estaremos interessados primordialmente na transformada de Fourier e 
sua inversa. Elas são as equações que têm significância física. 

Quando passamos o par de transformadas de Fourier para o espaço tridimensional, ele se torna 


1 f 
g(k) = ma / temer d?r, (15.23a) 
1 


EM e Stem —ikr 43 
f(x) = Ory fts dºk. (15.23b) 
As integrais estão em todo o espaço. A verificação, se quisermos, é imediata, substituindo o lado esquerdo de uma 
Equação no integrando da outra Equação e usando a função delta tridimensional.? A Equação (15.23b) pode ser 
interpretada como uma expansão de uma função f(r) em um contínuo de autofunções de onda plana; então, g(k) 
se torna a amplitude da onda, exp(—ik - r). 


Transformada de Co-Seno 

Se f(x) for par ou ímpar, essas transformadas podem ser expressas de uma forma um pouco diferente. Considere, 
em primeiro lugar, uma função par fe com f(x) = fe(—x). Escrevendo a exponencial da Equação (15.22) em 
forma trigonométrica, 


Je(w) = = ~ felt) (cos wt + isen wt) dt 


= L / Po cond (15.24) 
T Jo 


25(r1 r2) = (xı — x2)ó(y1 — y2)ó(z1 — z2) com integral de Fourier ó(x1 — x2) = aly paa expļikı (xı — x2)] dkı etc. 


27 
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sendo que a dependência de sen wt desaparece com a integração sobre o intervalo simétrico (—o0, 00). De modo 
semelhante, uma vez que cos wt é par, as Equações (15.23) se transformam em 


felz) = I gelw) cos wz dw. (15.25) 


As Equações (15.24) e (15.25) são conhecidas como transformadas de Fourier de co-seno. 


Transformada de Seno 
O par correspondente de transformadas de Fourier de seno é obtido admitindo que f(x) = — f.(—x), ímpar, e 
aplicando os mesmos argumentos de simetria. As equações são 


gsw) = a fs (tsen wt dt,’ (15.26) 
0 

fs(ax) = ER Is(w)sen wz dw. (15.27) 
0 


Pela última equação podemos desenvolver a interpretação física de que f(x) está sendo descrita por um contínuo 

de ondas senoidais. A amplitude de sen wz é dada por ,/2/T7gs(w), na qual gs(w) é a transformada de Fourier de 
seno de f(x). Veremos que a Equação (15.27) é a integral análoga ao somatório (Equação (14.24)). Interpretações 
similares são válidas para os casos de co-seno e exponencial. 

Se considerarmos as Equações (15.22), (15.24) e (15.26) como as transformadas integrais diretas, descritas por 
L Equação (15.10), Seção 15.1, as transformadas inversas correspondentes, L7! da Equação (15.11), são dadas 
pelas Equações (15.23), (15.25) e (15.27). 

Note que cada uma das transformadas de Fourier de co-seno e de seno envolve somente valores positivos (e 
zero) dos argumentos. Usamos a paridade de f(x) para estabelecer as transformadas; mas, uma vez estabelecidas as 
transformadas, o comportamento das funções f e g para argumento negativo é irrelevante. Na verdade, as próprias 
equações transformadas impõem uma paridade definida: par para a transformada de Fourier de co-seno e 
ímpar para a transformada de Fourier de seno. 


Exemplo 15.3.1 TREM DE ONDAS FINITO 

Uma importante aplicação da transformada de Fourier é a resolução de um pulso finito em ondas senoidais. Imagine 
que um trem de ondas sen wọt e seja limitado por célula de Kerr ou obturadores saturáveis de célula, de corante, 
de modo que temos 


NT 
sen wot, lt] < —, 
HO) = No (15.28) 
0, ft > —. 
Wo 


7 


Isso corresponde a N ciclos de nosso trem de ondas original (Figura 15.2). Uma vez que f(t) é ímpar, podemos 


usar a transformada de Fourier de seno (Equação (15.26)) para obter 


2 Nr/wo 
Gs(w) = zJ sen wotsen wt dt. (15.29) 
T Jo 


Integrando, encontramos nossa função amplitude: 


= |2 |senflwo — w)(Nm/wo)] _ sen[(wo + w)(Nr/wo)] 
gs(w) = VI So) GSE) (15.30) 


E de considerável interesse ver como g.(w) depende da fregiiência. Para wo e w = wo, somente o primeiro termo 
será de alguma importância por causa dos denominadores. Ele está representado no gráfico da Figura 15.3. Essa é 
a curva da amplitude para o padrão de difração de fenda única. 


Há zeros em 
wo—w Aw 


1 2 
Wo Wo N’ N’ 


e assim por diante. (15.31) 


Note que um fator —i foi absorvido nessa g(w). 
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fO 
A 


> É 


Figura 15.2: Trem de ondas finito. 


go) 


O = Ve 
Figura 15.3: Transformada de Fourier de trem de ondas finito. 


Para N grande, g.(w) também pode ser interpretada como uma distribuição delta de Dirac, como na Seção 1.15. 
Uma vez que as distribuições fora do máximo central são pequenas nesse caso, podemos considerar 
wo 
N 
uma boa medida da dispersão da freqüência de nosso pulso de onda. É claro que, se N for grande (um pulso longo), 


a dispersão da freqüência será pequena. Por outro lado, se nosso pulso for limitado e ficar curto, N pequeno, a 
distribuição de freqüência será mais larga e os máximos secundários serão mais importantes. E 


Aw = (15.32) 


Princípio da Incerteza 


Eis aqui um análogo clássico do famoso princípio da incerteza da Mecânica Quântica. Se estivermos tratando com 
ondas eletromagnéticas, 


h 

> =F, energia (de nosso fóton) 
T 

hA 

HAR SAR, (15.33) 
27 


sendo h a constante de Planck. Aqui, A É representa uma incerteza na energia de nosso pulso. Há também uma 
incerteza em relação ao tempo, porque nossa onda de N ciclos requer 2N 7 /wo segundos para passar. Considerando 


à 2NT 
a 


At l (15.34) 
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temos o produto dessas duas incertezas: 
hAw 27N 27N 
PR DA À ed EE a ça OS (15.35) 
wo 27N wo 
Na verdade, o princípio da incerteza de Heisenberg afirma que 
h 
AE. At > —, (15.36) 
47 
e isso é claramente satisfeito em nosso exemplo. 
Exercícios 
15.3.1 (a) Mostre que g(—w) = g*(w) é uma condição necessária e suficiente para f(x) ser real. 
(b) Mostre que g(—w) = —g* (w) é uma condição necessária e suficiente para f(x) ser imaginária 


pura. 


Nota: A condição da parte (a) é usada no desenvolvimento das relações de dispersão da Seção 7.2. 


15.3.2 Seja F(w) a transformada (exponencial) de Fourier de f(x) e G(w) a transformada de Fourier de 


g(x) = f(x + a). Mostre que 
G(w) = et F(w). 


15.3.3 A função 
-J1 o le<l 
HE 0, lel>1 
é uma função escalonada finita simétrica. 


(a) Ache ge(w), transformada de Fourier de co-seno de f(x). 
(b) Considerando a transformada inversa de co-seno, mostre que 


Fa) = 


2 [O senwcoswr 
dw. 
0 


T WwW 


(c) Pela parte (b), mostre que 


y% 0, je] > 1, 
/ SE apar 
0 w H 


15.3.4 (a) Mostre que as transformadas de Fourier de seno e co-seno de e7% são 


S 2 w (09) 2 a 
SiW) = RE RR cw) = E O Ad 
E V Tw? +a? 9 V Tw? +a? 


Sugestão: Cada uma das transformadas pode ser relacionada com a outra por integração por 


partes. 
(b) Mostre que 


oo 

W sen WT W. ia 

— z tu = e i xz >o0, 
o wl+a 


oo 
cos WT To. 
5 5 dy = mete, q >o0. 
o wWi+a 2a 


Esses resultados também são obtidos por integração de contorno (Exercício 7.1.14). 


15.3.5 Ache a transformada de Fourier do pulso triangular (Figura 15.4). 
a Hate, ol<a, 
EI = 
0, la] > 4. 


Nota: Essa função dá uma outra segiiência delta com h = a e a > oo. 
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fa) 


—1/a l/a 


Figura 15.4: Pulso triangular. 


15.3.6 Defina uma segiiência 
n, æl < zz 
n(x) = 1 


(Essa é a Equação (1.172)). Expresse ô, (x) como uma integral de Fourier (via o teorema integral 
de Fourier, transformada inversa etc.). Por fim, mostre que podemos escrever 


ó(x) = lim da(x) = + / e™*™*? dk. 
n=>00 sa 


15.3.7 Usando a seqiiência 


mostre que 


ó(x) A i E Pe dk. 


far e sm 
Nota: Lembre-se de que ó(x) é definida em termos de seu comportamento como parte de um 
integrando (Seção 1.15), em especial Equações (1.178) e (1.179). 


15.3.8 Derive as representações de seno e co-seno de ó(t — x) que são comparáveis com a representação 
exponencial, Equação (15.21d). 


OO OO 
Resposta. — / sen wtsen wz dw, — I cos wt cos wg dw. 
T Jo T Jo 


15.3.9 Em uma cavidade ressonante, uma oscilação eletromagnética de frequência wo se extingue como 
A(t) = Ape ot 20 ptndod t>0. 


(Considere A(t) = 0, para t < 0.) O parâmetro Q é uma medida da razão entre energia armazenada 
e perda de energia por ciclo. Calcule a distribuição de fregiência da oscilação, a*(w)a(w), em que 
a(w) é a transformada de Fourier de A(t). 
Nota: Quanto maior for Q, mais inclinada será sua linha de ressonância. 

A2 1 


Resposta: a* (w)a(w) = 27 (w — wo)? + (wo/20)2. 


15.3.10 Prove que 


h E eTit dw exp(— É) exp (— Hot), t Es 0, 
2ri J ~ Eo-iT/2-hw 0, t<0. 


Essa integral de Fourier aparece em uma variedade de problemas da Mecânica Quântica: penetração 
de barreira WKB (Wentzel-Kramers Brillouin), dispersão, teoria da perturbação dependente do 
tempo, e assim por diante. 

Sugestão: Tente integração de contorno. 


ELSEVIER 
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15.3.11 


15.3.12 


15.3.13 


15.3.14 


15.3.15 


15.3.16 


15.3.17 


15.3.18 


Verifique que as seguintes são transformadas integrais de Fourier uma da outra: 


2 1 
(a) E Ja a |z| < a, e Jo(ay), 
0, 


|z| > a, 
0, |z| <a, 
(b) E 1 
—4]| — ——, x| >a, e No(alyl), 
T 1 
(©) e  Ko(alyl). 


2 Vr? + a? 
(d) Você tem uma idéia de por que To(ay) não está incluída nessa lista? 


Sugestão: Jo, No e Ko podem ser transformadas com muita facilidade usando uma representação 
exponencial, invertendo a ordem de integração e empregando a representação exponencial da função 
delta de Dirac (Seção 15.2). Esses casos podem ser tratados igualmente bem como transformadas 
de Fourier de co-seno. 

Nota: A relação Ko parece conseqiiência de uma Equação de função de Green no Exercício 9.7.14. 
Um cálculo do campo magnético de um circuito de corrente circular em coordenadas cilíndricas 
circulares leva à integral 

OO 
/ cos kz k Ki(ka) dk. 
0 


Mostre que essa integral é igual a 
Ta 


2(22 + a2)3/2" 
Sugestão: Tente diferenciar o Exercício 15.3.11(c). 


Como extensão do Exercício 15.3.11, mostre que 


(o f Jo(y) dy =, o f No(y) dy = 0, (o f Ko(y) dy = 5. 
(0) 0 (0) 


A integral de Fourier, Equação (15.18), é considerada sem significado para f(t) = cos at. Mostre 
que a integral de Fourier pode ser estendida para cobrir f(t) = cos at pela utilização da função 
delta de Dirac. 


Mostre que 


oo 2 oy—1/2 
E: sen ho dd = | (2-0) s p<a, 
0 0, pP >a. 


Aqui, a e p são positivos. A equação resulta da determinação da distribuição de cargas em um disco 
condutor isolado, de raio a. Note que a função à direita tem uma descontinuidade infinita p = a. 
Nota: A abordagem da transformada de Laplace aparece no Exercício 15.10.8. 


A função f(r) tem uma transformada exponencial de Fourier, 


1 ean Si 
g(k) = ama | fee dre som 


Determine f(r). 
Sugestão: Use coordenadas polares esféricas no espaço k. 


R ta: = —. 
esposta: f(r) I 
(a) Calcule a transformada exponencial de Fourier de f(x) = el, 

(b) Calcule a transformada inversa empregando o cálculo de resíduos (Seção 7.1). 


Mostre que as seguintes são transformadas de Fourier uma da outra. 


2 -1/2 
PR e Ênio?) 5. els 


0, |z| > 1. 
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Tn (x) é a polinomial de Chebyshev de enésima ordem. 
Sugestão: Com T, (cos 6) = cos nð, a transformada de Tp (x) (1 2)” */2 leva a uma representação 
integral de J,(t). 


15.3.19 Mostre que a transformada exponencial de Fourier de 


_ J Pu), lu<tl, 


é (24º /27) jn(kr). Aqui, P, (pu) é uma polinomial de Legendre e j„ (kr) é uma função de Bessel 
esférica. 


15.3.20 Mostre que a transformada exponencial tridimensional de Fourier de uma função radialmente 
simétrica pode ser reescrita como uma transformada de Fourier de seno: 


aaj Fr) dz -Af [rf(r)]sen kr dr. 


15.3.21 (a) Mostre que f(x) = q 1/2 € auto-recíproca sob as transformadas de Fourier de co-seno e seno, 


isto é, 
2 oo 
TE) x71? cos ztd = t", 
4/ — f a 2sen ztds = t71. 


(b) Use os resultados precedentes para avaliar as integrais de Fresnel do cos(y?) dy e 
Ji sen(y?) dy. 


15.4 Transformada de Fourier de Derivadas 
Na Seção 15.1, a Figura 15.1 delineia a técnica geral de usar transformadas de Fourier e transformadas inversas 
para resolver um problema. Aqui damos um passo inicial na resolução de uma equação diferencial obtendo a 
transformada de Fourier de uma derivada. 

Usando a forma exponencial, determinamos que a transformada de Fourier de f(x) é 


1 Fe ; 
glw) = To D Je!” da, (15.37) 
e para df (x)/dx, 
1 [E dia) i 
== ee da. 15. 
gı(w) z q de (15.38) 
Integrando a Equação (15.38) por partes, obtemos 
etar 
= e™? dr. 15.39 
Se f(x) desaparecer! quando z — +00, temos 
giw) = —iw g(w); (15.40) 


isto é, a transformada da derivada é (—iw) vezes a transformada da função original. Isso pode ser imediatamente 
generalizado para a enésima derivada, dando como resultado 


In(w) = (—iw)” g(w), (15.41) 


contanto que todas as partes integradas desapareçam quando x — +00. Esse é o poder da transformada de Fourier, 
a razão por que ela é tão útil para resolver equações diferenciais (parciais). A operação de diferenciação foi 
substituída por uma multiplicação no espaço w. 


4A parte os casos como o Exercício 15.3.6, f (x) deve desaparecer quando x — oo, para que a transformada de Fourier de f(x) exista. 
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Exemplo 15.4.1  EQuação DE ONDA 

Essa técnica pode ser usada com vantagem no tratamento de EDPs. Para ilustrar a técnica, vamos derivar uma 
expressão familiar da Física elementar. Uma corda infinitamente longa está vibrando livremente. A amplitude y 
das vibrações (pequenas) satisfaz a Equação de onda 


02y 1 3y 

Eae ms e 15.42 

dar? v Ot ( ) 
Vamos admitir uma condição inicial 

y(x,0) = f(x), (15.43) 


em que f é localizada, isto é, se aproxima de zero em x grande. 
Aplicando nossa transformada de Fourier em x, o que significa multiplicar por e'º”, e integrando sobre zx, 


obtemos Sm oyl 
Io o dx =3 sS Hat da (15.44) 
ou o PY (ot) 3) 
1 
= N2 
(—ia) Y (a, t) = 2 oe | (15.45) 
Aqui, usamos 
Y (a, t) e d 15.46 
e -zæ e i pae 


e a Equação (15.41) para a derivada de segunda ordem. Note que a parte integrada da Equação (15.39) se anula: 
a onda ainda não foi a +00 porque está se propagando para diante no tempo e não há nenhuma fonte no infinito 
porque f(-+00) = 0. Uma vez que não aparece nenhuma derivada em relação a a, a Equação (15.45) é, na 
verdade, uma EDO, ou seja, a Equação do oscilador linear. Essa transformação, de uma EDP para uma EDO, é um 
feito significativo. Resolvemos a Equação (15.45) sujeita às condições iniciais adequadas. Em t = 0, aplicando a 
Equação (15.43), a Equação (15.46) se reduz a 


Y(a,0) = =|. F(ax)e' de = F(a). (15.47) 


A solução geral da Equação (15.45) em forma exponencial é 


Y (a, t) = Ele, (15.48) 


Usando a fórmula de inversão (Equação (15.23)), temos 


1 Ni 
y(x, t) = T J. Y (a, t)e "da, (15.49) 
e, pela Equação (15.48), 
1 E aar 
ylz, t) = Na J $ F(a)e “(FD da. (15.50) 


Uma vez que f(x) é a transformada inversa de Fourier de F(a), 


ylz, t) = f(x F vt), (15.51) 


correspondente às ondas que avançam nas direções +x e —x, respectivamente. 
As combinações lineares de ondas particulares são dadas pela condição de contorno da Equação (15.43) e 
alguma outra condição de contorno, tal como uma restrição sobre Oy /Ôt. 


A proeza que a transformada de Fourier realiza aqui merece destaque especial. 
e Nossa transformada de Fourier converteu uma EDP em uma EDO, em que o “grau de transcendência” do 

problema foi reduzido. 

Na Seção 15.9, transformadas de Laplace são usadas para converter EDOs (com coeficientes constantes) em 
equações algébricas. Mais uma vez, o grau de transcendência é reduzido. O problema é simplificado, como mostra 
a Figura 15.1. 
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Exemplo 15.4.2 EDP Do FLUXO DE CALOR 


Para ilustrar outra transformação de uma EDP em uma EDO, vamos aplicar a transformada de Fourier à Equação 
diferencial parcial do fluxo de calor 


db _ 22% 
ot TF 0x2" 


em que a solução y(x, t) é a temperatura no espaço como uma função do tempo. Considerando a transformada de 
Fourier de ambos os lados dessa Equação (note que, aqui, somente w é a variável da transformada conjugada para 
x porque t é o tempo na EDP do fluxo de calor), em que 


V(w,t) = A ylz, te“? dz, 


isso resulta em uma EDO para a transformada de Fourier Y de 1) na variável de tempo t, 


atwt) 


ET -aw P(w, t). 


Integrando, obtemos 
In Y = -awt +nC ou Ų = Cehe t 


em que a constante de integração C ainda pode depender de w e, em geral, é determinada por condições iniciais. De 
fato, C = Y (w, 0) é a distribuição espacial inicial de Y, portanto é dada pela transformada (em x) da distribuição 
espacial inicial de 4), a saber, Y(x, 0). Colocando essa solução de volta em nossa transformada inversa de Fourier, 
temos como resultado 


1 Se ; 2, 2 
y(x, t) = T Cu) eT A t dw. 


Por simplicidade, aqui consideramos C independente de w (admitindo uma distribuição de temperatura inicial de 
função delta) e integramos completando o quadrado em w, como no Exemplo 15.1.1, fazendo as trocas adequadas 
de variáveis e parâmetros (a? — a2t, w — x,t — —w). Isso resulta na solução particular da EDP de fluxo de 
calor, 


C xr? 
vad = g-a) 


que aparece como uma hipótese inteligente no Capítulo 8. Na verdade, mostramos que 1) é a transformada inversa 
de Fourier de C exp(—aZw?t). E 


Exemplo 15.4.3 inversão DE EDP 
Derive a integral de Fourier para a função de Green Go da EDP de Poisson, que é uma solução de 


VºGolr,r)=-d(r — r’). 
Uma vez conhecida Go, a solução geral da EDP de Poisson, 
V26 = —4rp(r) 


da eletrostática, é dada como 
D(r) = / Go(r,r)4mp(r”) dr. 
Aplicando V? a & e usando a EDP que a função de Green satisfaz, verificamos que 


V2d(r) = J V Gorint’) dr = - [oa — r)4xp(r” r’ = —4rpo(r). 


“livro” — 2007/81 — 15:06 — page 719 — #729 


15. TRANSFORMADAS INTEGRAIS 719 


ELSEVIER 


Agora usamos a transformada de Fourier de Go, que é go, e desta a da função ô, escrevendo 


1 dp - 1 dèp 
y2 ip- (r—r') = -f ip(r—r”) i 
Jupke (27)? e (27)? 


Como os integrandos de integrais de Fourier iguais devem ser os mesmos em (quase) todo lugar, o que resulta da 
transformada inversa de Fourier, e com 


Veip(r>r) E, ipe'P (rr), 


isso resulta em —p2go(p) = —1. Por conseguinte, a aplicação do laplaciano à integral de Fourier f (r) corresponde 
a multiplicar sua transformada de Fourier g(p) por —p?. Substituir essa solução na transformada inversa de Fourier 
para Go resulta em 


G IN = ip- (r—r') = : 
oler) fe (2m)p? Arr — r'| 


Podemos verificar a última parte desse resultado aplicando V° a Go novamente e lembrando, do Capítulo 1, que 
y?’ FF = —4rô(r — r’). 


A transformada inversa de Fourier pode ser avaliada usando coordenadas polares, explorando a simetria esférica 
de p°. Por simplicidade, escrevemos R = r — r e denominamos 6 o ângulo entre R e p, 


a dp oo 1 f 27 
eCPRÍO — dp e'PR cos? d cos 6 dy 
2 
p 0 = 0 


Sa É dP ipRcos0 E = 47 + Senior 
iRJo P cosg=-—1 R Jo p 
47 f° senpR 27? 
0 pR R 
em que O e p são os ângulos de p e Jo sen 2 dy = & do Exemplo 7.1.4. Dividindo por (27)2, obtemos 
Go(R) = 1/(47R), como afirmamos. Uma avaliação dessa transformada de Fourier por integração de contorno é 
dada no Exemplo 9.7.2. E 


Exercícios 

15.4.1 A equação de idade de Fermi unidimensional para a difusão de nêutrons que desaceleram em algum 

meio (como grafite) é 
3’qlz, T) _ qlz, T) 
ðr? — ðr ` 

Aqui, q é o número de nêutrons que desaceleram, caindo abaixo de alguma dada energia por segundo 
por unidade de volume. A idade de Fermi, 7, é uma medida da perda de energia. 
Se q(x, 0) = S(x), correspondente a uma fonte plana de nêutrons em x = 0, emitindo S nêutrons 


por unidade de área por segundo, derive a solução 


2 
e” /47 


=S ! 
q VÅTT 


Sugestão: Substitua q(x, T) por 


1 a 
p(k,T) = r. qlz, T)e"? dz. 


Isso é análogo à difusão de calor em um meio infinito. 
15.4.2 A Equação (15.41) resulta em 
glv) = —w?g(w) 
para a transformada de Fourier da derivada de segunda ordem de f(x). A condição f(x) — O 


para x — +oo pode ser ligeiramente relaxada. Ache a condição menos restritiva para a equação 
precedente para que g>(w) seja válida. 
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Resposta: Es — 
da 


15.4.3 A equação de difusão de nêutrons unidimensional com uma fonte (plana) é 


d2 (x) 
dx? 


=D + K?’ Do(x) = QU(a), 
em que y(x) é o fluxo de nêutrons, Qô(x) é a fonte (plana) em x = 0, e D e K? são constantes. 


Aplique a transformada de Fourier. Resolva a equação em espaço de transformada. Transforme sua 
solução de volta ao espaço zx. 


Ecs ERR 


2KD 
15.4.4 Para uma fonte pontual na origem, a Equação de difusão de nêutron tridimensional se torna 


Resposta: y(x) = 


-DV2y(r) + KºDo(r) = Qó(r). 


Aplique uma transformada de Fourier tridimensional e resolva a equação transformada. Transforme 
a solução de volta ao espaço r. 
15.4.5 (a) Dado que F(k) é a transformada tridimensional de Fourier de f(r) e Fi(k) é a transformada 
tridimensional de Fourier de V f(r), mostre que 


Fi (k) = (—ik)F (k). 


Essa é a generalização tridimensional da Equação (15.40). 
(b) Mostre que a transformada tridimensional de Fourier de V - V f(r) é 


Fy(k) = (—ik)?F (k). 


Nota: O vetor k é um vetor no espaço da transformada. Na Seção 15.6 teremos k = p, 
momento linear. 


15.5 Teorema de Convolução 


Empregaremos convoluções para resolver equações diferenciais, normalizar funções de onda de momentum 
(Seção 15.6) e para investigar funções de transferência (Seção 15.7). 


Figura 15.5: Exemplo de “dobradura”. 


Vamos considerar duas funções f(x) e g(x) com transformadas de Fourier F(t) e G(t), respectivamente. 
Definimos a operação 


fxg= ne A gly) f(x — y) dy (15.52) 


como a convolução das duas funções f e g no intervalo (—oo, o0). Essa forma de uma integral aparece na teoria da 
probabilidade na determinação da densidade de probabilidade de duas variáveis aleatórias independentes. Nossa 
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solução da equação de Poisson, Equação (9.148), pode ser interpretada como uma convolução de uma distribuição 
de carga, p(r2) e uma função de peso, (4reo|rı — r2|) 71. Em outras palavras, às vezes nos referimos a isso 
como Faltung, usando a palavra alemã para “dobradura.” Agora transformamos a integral na Equação (15.52) 
introduzindo as transformadas de Fourier: 


D gly) f(z — y)dy = = e gly) A F(t)e “CE dt dy 


pu eh e Es ity | —aita 
= | rolf soea a 
E FOGO"? dt, (15.53) 


permutando a ordem de integração e transformando g(y). Esse resultado pode ser interpretado como segue: a 
transformada inversa de Fourier de um produto de transformadas de Fourier é a convolução das funções originais, 
f*g. 

Para o caso especial x = 0, temos 


f rocoa= f" tsoa. (15.54) 


O sinal de menos em —y sugere que tentemos modificações. Agora fazemos isso com g* em vez de g usando uma 
técnica diferente. 


Relação de Parseval 
Resultados análogos das Equações (15.53) e (15.54) podem ser derivados para as transformadas de Fourier de seno 
e co-seno (Exercícios 15.5.1 e 15.5.3). A Equação (15.54) e as correspondentes convoluções de seno e co-seno 
costumam ser denominadas relações de Parseval por analogia com o teorema de Parseval para séries de Fourier 
(Capítulo 14, Exercício 14.4.2). 

A relação de Parseval”, 


o F(w)G* (w) dw = f Ft)g* (t) dt (15.55) 


pode ser derivada de um modo elegante usando a representação de função delta de Dirac, Equação (15.21d). Temos 


T OLHO a= f =f Floor isto = G'(a)ei”! da dt, (15.56) 


com atenção à conjugação complexa na transformação de G* (x) para g*(t). Integrando em primeiro lugar sobre t 
e usando a Equação (15.2 1d), obtemos 


ftrma= f rof crtaite dedo 


= / F(w)G* (w) dw, (15.57) 
nossa desejada relação de Parseval. Se f(t) = g(t), então as integrais na relação de Parseval são integrais de 
normalização (Seção 10.4). A Equação (15.57) garante que, se uma função f(t) for normalizada para unidade, sua 
transformada F (w) também é normalizada para unidade, o que é de extrema importância em Mecânica Quântica, 
como veremos na próxima seção. 

Pode-se mostrar que a transformada de Fourier é uma operação unitária (no espaço de Hilbert L2, funções 
quadrado de integráveis). A relação de Parseval é uma reflexão dessa propriedade unitária, análoga ao 
Exercício 3.4.26 para matrizes. 

Na óptica de difração de Fraunhofer, o padrão de difração (amplitudes) aparece como a transformada da 
função que descreve a abertura (compare com o Exercício 15.5.5). Com intensidade proporcional ao quadrado 


5A Figura 15.5 mostra um gráfico para f(y) = e”, f(y), em que fica claro que f(x — y) são imagens especulares uma da outra em 
relação à reta vertical f(y) e f(x — y). Isso significa que poderíamos gerar y = x/2, dobrando f(x — y) sobre a reta f(y) y = x/2. 

Note que todos os argumentos são positivos, ao contrário da Equação (15.54). 

7 Alguns autores preferem restringir o nome Parseval à série e referir-se à Equação (15.55) como teorema de Rayleigh. 
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da amplitude, a relação de Parseval implica que a energia que passa pela abertura parece estar em algum lugar do 
padrão de difração — uma afirmação da conservação de energia. Relações de Parseval podem ser desenvolvidas 
independentemente da transformada inversa de Fourier e então usadas rigorosamente para derivar a transformada 
inversa. Detalhes são dados por Morse e Feshbach,? Seção 4.8 (veja também o Exercício 15.5.4). 


Exercícios 
15.5.1 Resolva a equação de convolução correspondente à Equação (15.53) para 


(a) Transformadas de Fourier de seno 


1 


sD owt +u- = f7 EG) cosse ds, 


em que f e g são funções ímpares. 
(b) Transformadas de Fourier de co-seno 


1 


z lo g) [F y +x) + f(x -— y)] dy = e Fe(s)Ge(s) cos sz ds, 


em que f e g são funções pares. 
15.5.2 F(p) e G(p) são as transformadas de Hankel de f(r) e g(r), respectivamente (Exercício 15.1.1). 
Derive a relação de Parseval de transformada de Hankel 


I “ PMGlp)pdo= / PUTE, 


15.5.3 Mostre que para ambas as transformadas de Fourier de seno e co-seno a relação de Parseval tem a 
forma 


J "FOGA dt = I E 
0 0 


15.5.4 Partindo da relação de Parseval (Equação (15.54)), faça g(y) = 1,0 < y < a, e zero em todos os 
outros lugares. A partir disso, derive a transformada inversa de Fourier (Equação (15.23)). 
Sugestão: Diferencie com relação a a. 


15.5.5 (a) Um pulso retangular é descrito por 


1, lIzx|<a, 


ra=] o alsa. 


Mostre que a transformada exponencial de Fourier é 


F(t) = = 
w t 


Esse é o problema da difração de fenda única da óptica física. A fenda é descrita por f(x). A 
amplitude do padrão de difração é dada pela transformada de Fourier F(t). 
(b) Use a relação de Parseval para avaliar 


Essa integral também pode ser avaliada usando o cálculo de resíduos, Exercício 7.1.12. 
Resposta: (b) 7. 
15.5.6 Resolva a Equação de Poisson, V2wW(r) = —p(r)/£o, pela seguinte seqiiência de operações: 


(a) Considere a transformada de Fourier de ambos os lados dessa equação. Resolva para a 
transformada de Fourier de y(r). 

(b) Efetue a transformada inversa de Fourier usando uma analogia tridimensional do teorema da 
convolução, Equação (15.53). 


8P, M. Morse e H. Feshbach, Methods of Theoretical Physics, Nova York: McGraw-Hill (1953). 
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15.5.7 (a) Dada f(x) = 1 — |x/2|,—2 < « < 2, e zero em todos os outros lugares, mostre que a 
transformada de Fourier de f(x) é 


2 
Resposta: (b) T ; 


15.5.8 Sendo F(t) e G(t) as transformadas de Fourier de f(x) e g(x), respectivamente, mostre que 
Re 2 i 2 
/ |f(x) — g(x)| do= [ F(t) — G|" dt. 


Se g(x) for uma aproximação de f(x), a relação precedente indica que a média dos desvios ao 
quadrado no espaço t é igual à média dos desvios ao quadrado no espaço zx. 


15.5.9 Use a relação de Parseval para calcular 


e dw o widy 
SS ——s b — r. 
oJ r OJ trer 
Sugestão: Compare com o Exercício 15.3.4. 
T T 


b) —. 
Ja ) za 


Resposta. (a) 
15.6 Representação de Momentum 


Em Dinâmica Avançada e em Mecânica Quântica, momento linear e posição espacial ocorrem em pé de 
igualdade. Nesta seção começaremos com a distribuição espacial usual e derivaremos a distribuição de momentum 
correspondente. Para o caso unidimensional, nossa função de onda y(x) tem as seguintes propriedades: 

1. Y“ (x)(x) dx é a densidade de probabilidade de encontrar uma partícula quântica entre x e x + dx, e 


2. T W(a)y(a) da = 1 (15.58) 


corresponde à probabilidade unitária. 
3. Além disso, temos 


(x) = a y“ (x)ey(x) de (15.59) 


para a posição média da partícula ao longo do eixo x que costuma ser denominada valor esperado. 


Queremos uma função g(p) que dará a mesma informação sobre o momentum: 
1. 9*(p)g(p) dp é a densidade de probabilidade de que nossa partícula quântica tenha um momentum entre p e 


p+ dp. 


A fo swsna=1. (15.60) 
3 (p) = L g*(p)p g(p) dp. (15.61) 
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Como mostraremos na segiiência, tal função é dada pela transformada de Fourier de nossa função espaço y(x). 
Especificamente,” 


1 So 
= —— ipe q 15.62 
g(p) TO Es y(x)e T, (15.62) 
1 oo ! 
*(p) = —— *(x)e®/? dg. 15. 
g” (p) zz” (x)e dx (15.63) 


A função momentum tridimensional correspondente é 


J(p) = E HH diet dèr, 


Para verificar as Equações (15.62) e (15.63), vamos verificar as propriedades 2 e 3. 
A propriedade 2, a normalização, é automaticamente satisfeita como uma relação de Parseval, Equação (15.55). 
Se a função espaço y(x) é normalizada à unidade, a função de momentum g(p) também é normalizada à unidade. 
Para verificar a propriedade 3, devemos mostrar que 


W= f roroa f rood, (15.64 


em que (h/i)(d/dx) é o operador de momentum na representação de espaço. Substituímos as funções de 
momentum por funções de espaço nas quais efetuamos transformação de Fourier, e a primeira integral se torna 


7 i! l / pele) (x)(x) dp da! de. Gero) 


— 00 


Agora usamos a identidade de onda plana 


perinte-a/h d [žere], (15.66) 


“deli 


sendo p uma constante, não um operador. Substituindo na Equação (15.65) e integrando por partes, mantendo z’ e 
p constantes, obtemos 


(p) = I [zz T giple-e)/h dp WEE ya) dx' da. (15.67) 
Th Jo i dx 


Aqui, admitimos que (x) se anula quando x —> «oo, eliminando a parte integrada. Usando a função delta de 
Dirac, Equação (15.21c), a Equação (15.67) se reduz à Equação (15.64) para verificar nossa representação de 
momentum. 

Como alternativa, integração sobre p é efetuada primeiro na Equação (15.65), levando a 


jl pe 'P(r=2)/h dp = 2mih26 (x — x), 


e usando o Exercício 1.15.9, podemos efetuar a integração sobre x, o que transforma Y(x) em —dy(x")/da'. A 
integral restante sobre z’ é o lado direito da Equação (15.64). 


92 A h pode ser evitada usando o número de onda k, p = kh (e p = kh), portanto 


olk) = o | utaerite do. 


Um exemplo dessa notação aparece na Seção 16.1. 
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Exemplo 15.6.1 Áromo DE HIDROGÊNIO 
O estado fundamental do átomo de hidrogênio!? pode ser descrito pela função de onda espacial 


142 
w= (5) Erro (15.68) 


TaY 


sendo ag o raio de Bohr, 4regoħ?/me?. Agora temos uma função de onda tridimensional. A transformada 
correspondente à Equação (15.62) é 


1 —ip-r/h 
0) = (aan | VOC E (15.69) 
Substituindo a Equação (15.68) na Equação (15.69) e usando 
; 8ra 
—ar+ib-r 933, — 
fe dºr = (2 +02 TO’ (15.70) 


obtemos a função de onda de momentum hidrogênica, 


A 23/2 agl? h5/2 


; 15.71 
7 (agp +MY E 


g(p) 


Essas funções de momentum mostraram ser úteis em problemas como o espalhamento Compton de elétrons 
atômicos, a distribuição de comprimento de ondas da radiação dispersa, dependendo da distribuição do momentum 
dos elétrons-alvo. 

A relação entre a representação de espaço ordinário e a representação de momentum pode ser esclarecida 
considerando as relações de comutação básicas da Mecânica Quântica. Passamos de uma hamiltoniana clássica 
para a equação de onda de Schrödinger impondo que o momentum p e a posição x não comutem. Em vez disso, 
exigimos que 

[p, £] = px — zp = —iħ. (15.72) 


Para o caso multidimensional, a Equação (15.72) é substituída por 
[pi, £j] = —iħô;j. (15.73) 


A representação de espaço de Schrödinger é obtida usando 


substituindo o momentum por uma derivada parcial de espacial. Vemos que 


lp, 2)b(x) = —itap(a). (15.74) 
Contudo, a Equação (15.72) também pode ser satisfeita igualmente bem usando 
p>p: moh. 
I Op; 


Essa é a representação de momentum. Então, 


lp, z]g(p) = —ihg(p). (15.75) 


Por conseguinte, a representação (x) não é única; (p) é uma possibilidade alternativa. 

Em geral, a representação (x) de Schrödinger que leva à equação de onda de Schrödinger é mais conveniente 
porque a energia potencial V geralmente é dada como uma função de posição V (x,y,z). A representação de 
momentum (p) usualmente leva a uma equação integral (compare com o Capítulo 16 para os prós e contras das 
equações integrais). Como exceção, considere o oscilador harmônico. E 


l0Ver E. V. Ivash, A momentum representation treatment of the hydrogen atom problem. Am. J. Phys. 40: 1.095 (1972), se quiser um 
tratamento de representação de momentum dos estados | = O do átomo de hidrogênio. 
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Exemplo 15.6.2  OscILADOR HARMÔNICO 
A hamiltoniana clássica (energia cinética + energia potencial = energia total energy) 
pP 1 
H(p, £) = +— + -kr? = E, (15.76) 
2m 2 
em que k é a constante da lei de Hooke. 
Na representação de Schrödinger obtemos 
h2 dyle) 1 
kz? = Eú(a). 15.77 
oo + zka?y(a) = Eyle) (15.77) 
Para energia total E igual a 4/(k/m)h/2 há uma solução não-normalizada (Seção 13.1), 
p(x) = e (Vmk/2ha?, (15.78) 
A representação de momentum leva a 
2 21. J2 
p hfk dºg(p) 
=E ; 15.7 
am SP) 7 dp g(p) (15.79) 
Mais uma vez, para 
k h 
Saes (15.80) 
m 2 
a equação de onda de momentum (15.79) é satisfeita pela não-normalizada 
glp) = e Pie, (15.81) 


Qualquer das representações, de espaço ou de momentum (e um número infinito de outras possibilidades) pode ser 


usada, dependendo da que for mais conveniente para o problema particular em questão. 


Deixamos para o Exercício 15.6.3 a demonstração de que g(p) é a função de onda de momentum correspondente 


à Equação (15.78), que é a transformada inversa de Fourier da Equação (15.78). E 
Exercícios 
15.6.1 A função e'k” descreve uma onda plana de momentum p = ñik normalizada para densidade 


unitária. (Admite-se a dependência de tempo de et. Mostre que essas funções de onda plana 


satisfazem uma relação de ortogonalidade.) 


festas dy dz = (2m)ºô(k — k’). 


15.6.2 | Uma onda plana infinita em Mecânica Quântica pode ser representada pela função 


ya) = e'ar, 


Ache a função distribuição de momentum correspondente. Note que ela tem um infinito e que (x) 


não é normalizada. 


15.6.3 Um oscilador quântico linear em seu estado fundamental tem uma função de onda 


p(z) = a V2q—1/4e-2?/20º 
Mostre que a função de momentum correspondente é 
g(p) = al/2m—1/4h-1/2p-02p?/26?. 


15.6.4 | O enésimo estado excitado do oscilador quântico linear é descrito por 


valr)=a 1/29 n/27 1/4 (nl) 1/26 22/20 H (r/a), 


em que H„(x/a) é o enésimo polinômio de Hermite, Seção 13.1. Como uma extensão do Exercício 


15.6.3, ache a função momentum correspondente a 1), (x). 


Sugestão: W,(x) pode ser representada por (à')"bo(x), em que à! é o operador de elevação, 


Exercícios 13.1.14 a 13.1.16. 


ELSEVIER 
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15.6.5 


15.6.6 


15.6.7 


15.6.8 


15.6.9 


15.6.10 


Uma partícula livre na Mecânica Quântica é descrita por uma onda plana 
P P P 
Py (a, t) =Z etlkz— (k? /2m)t] . 


Combinando ondas de momentum adjacente com um fator de peso de amplitude y(k), formamos 
um pacote de ondas 


(e,t) = / g(kjeilta= (ht? /2m) dp, 
(a) Resolva para (k), dado que 
a —a2 [202 

V(x,0) = e ; 

(b) Usando o valor conhecido de (k), integre para obter a forma explícita de Y (x,t). Note que 
esse pacote de ondas se difunde ou se espalha com o tempo. 

e {7°/2la”+(iñ/m)t]} 
[1 + (iħt/ma2)]!/2 ` 
Nota: Uma discussão interessante desse problema do ponto de vista do operador de evolução é 
apresentada por S. M. Blinder, Evolution of a Gaussian wave packet, Am. J. Phys. 36: 525 (1968). 


Resposta: Y (x,t) = 


Ache a função de onda de momento dependente de tempo g(k,t) correspondente a W(a,t) do 
Exercício 15.6.5. Mostre que o pacote de ondas de momento g*(k,t)g(k,t) é independente do 
tempo. 


O dêuteron, Exemplo 10.1.2, pode ser descrito razoavelmente bem com uma função de Hulthén 
Yle) = Afe — eémyr 


com 4, a e 3 constantes. Ache g(p), a função de momentum correspondente. 
Nota: A transformada de Fourier pode ser reescrita como transformadas de Fourier de seno e co- 
seno ou como uma transformada de Laplace, Seção 15.8. 


O fator de forma nuclear F'(k) e a distribuição de carga p(r) são transformadas tridimensionais de 


Fourier uma da outra: 
1 


F(k) = ESEE fone dr. 


Se o fator de forma medido é 


ache a distribuição de carga correspondente. 


2 
Resposta: p(r) = T E 
T r 


Verifique a normalização da função de onda de momentum do hidrogênio 


E 23/2 agl? hë/2 


por avaliação direta da integral 
/ 9“(p)a(p) Pp. 


Sendo (xr) uma função de onda em um espaço ordinário e (p) a função momentum 
correspondente, mostre que 


ma | VOP dr = ih Volp), 


Eri)? I r?y(r)e =P" dr = (ih Vp)?’o(p). 


“livro” — 2007/8/1 — 15:06 — page 728 — #738 


728 Física Matemática Arfken e Weber ELSEVIER 


Nota: V p é o gradiente em espaço de momentum: 


.Ô 43 ð 0 
Xx r 
pr % py pz 


Esses resultados podem ser estendidos para qualquer potência inteira positiva de r e, portanto, para 
qualquer função (analítica) que possa ser expandida como uma série de Maclaurin em r. 


15.6.11 A função de onda de espaço ordinário (r,t) satisfaz a equação de Schrödinger dependente do 


tempo 
OW (rs t) Ro 
h 2 ess é 
i dE Te Viy +V (r) 
Mostre que a função de onda de momentum dependente de tempo correspondente satisfaz a equação 
análoga, 
„3p t P i 
h— = — VGA Vo). 
' ot Im ? PEA 


Nota: Admita que V (r) pode ser expressa por uma série de Maclaurin e use o Exercício 15.6.10. 
V (ih Vp) é a mesma função da variável ih V, que V(r) é da variável r. 


15.6.12 A equação de onda de Schrödinger unidimensional independente de tempo é 


R y(x) 
2m dr? 


+ V(z)y(z) = Ey(2). 


Para o caso especial de V(x), uma função analítica de x, mostre que a equação de onda de 
momentum correspondente é 


V (nã) ot + Lg(p) = Eg(p). 


Derive essa equação de onda de momentum da transformada de Fourier, Equação (15.62), e sua 
inversa. Não use a substituição de x — ih(d/dp) diretamente. 


15.7 Função de Transferência 


Um pulso elétrico dependente de tempo pode ser considerado formado de uma superposição de ondas planas de 
muitas fregiiências. Para frequência angular w, temos uma contribuição 


F(w)e'“t. 
Então, o pulso completo pode ser escrito como 
l a iwt 
fO = — F(w)e'* dw. (15.82) 
2E RSRS 
Como a freqüência angular w está relacionada com a freqüência linear v por 
w 
v= — 
2m’ 


é costumeiro associar todo o fator 1/27 com essa integral. 
Mas, se w é uma fregiiência, o que dizer das freqüências negativas? A w pode ser considerada um artifício 
matemático para evitar tratar com duas funções (cos wt e sen wt) separadamente. (Compare com a Seção 14.1.) 
Como a Equação (15.82) tem a forma de uma transformada de Fourier, podemos resolver para F (w) escrevendo 
a transformada inversa, 


F(w) = / j Fe dt. (15.83) 


A Equação (15.83) representa uma resolução do pulso f(t) em suas componentes de freqüência angular. A 
Equação (15.82) é uma síntese do pulso a partir de suas componentes. 
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fO KU) 
— —— +» 


Entrada Saída 
Figura 15.6: Servomecanismo ou amplificador estéreo. 


Considere algum dispositivo, tal como um servomecanismo ou um amplificador estéreo (Figura 5.6), com uma 
entrada f(t) e uma saída g(t). Para uma entrada de uma única freqüência w, fu(t) = e'“*, o amplificador alterará a 
amplitude e pode também mudar a fase. As mudanças provavelmente dependerão da freqüência. Por conseguinte, 


Just) = p(w) folt). (15.84) 


Essa função p(w) modificadora de amplitudes e fase é denominada função transferência e usualmente será 
complexa: 
lw) = u(w) + iv(w), (15.85) 
em que as funções u(w) e v(w) são reais. 
Na Equação (15.84) admitimos que a função transferência y(w) é independente da amplitude de entrada e da 
presença ou ausência de quaisquer outras componentes da freqiiência. Isto é, estamos admitindo um mapeamento 
linear de f(t) para g(t). Então, a saída total pode ser obtida integrando sobre a entrada inteira, como modificada 


pelo amplificador 
1 øf” ; 
g(t) = =) plw)F(w)e" dw. (15.86) 


A função transferência é característica do amplificador. Uma vez conhecida (medida ou calculada) a função 
transferência, a saída g(t) pode ser calculada para qualquer entrada f(t). Vamos considerar (w) a transformada 
(inversa) de Fourier de alguma função Ẹ (t): 


oO 


ylw) = / (te “dt. (15.87) 


Então, a Equação (15.86) é a transformada de Fourier de duas transformadas inversas. Da Seção 15.5 obtemos a 
convolução 


(= f(r)B(t — 7) dr (15.88) 


Interpretando a Equação (15.88), temos uma entrada — uma “causa” — f (T), modificada por D(t — 7), 
produzindo uma saída — um “efeito” — g(t). Adotando o conceito da causalidade — a causa precede o efeito 
devemos requerer que 7 < t. Fazemos isso impondo 


(t-r)=0, Tot: (15.89) 
Então a Equação (15.88) se torna 
o= f f(T) — 7) dr (15.90) 
A adoção da Equação (15.89) tem profundas consegiiências aqui e também na teoria da dispersão, Seção 7.2. 
Significância de (t) 
Para ver a significância de O, seja f(T) um impulso repentino começando em 7 = 0, 
f(T) = (7), 


em que ó(7) é uma distribuição delta de Dirac no lado positivo da origem. Então a Equação (15.90) se torna 


= [. s(1)d(t — 7) dr 


Jet), t>0, 
g(t) E 0, t<o. 


(15.91) 
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Isso identifica &(t) como a função saída correspondente a um impulso unitário em t = 0. A Equação (15.91) 
também serve para estabelecer que D(t) é real. Nossa função transferência original dá a saída de estado estável 
correspondente a uma entrada de amplitude unitária e fregiiência única. D(t) e p(w) são transformadas de Fourier 
uma da outra. 

Pela Equação (15.87) agora temos 


ylw) = o (tje dt, (15.92) 
0 


com o limite inferior igualado a zero por causalidade (Equação (15.89)). Com &(t) real pela Equação (15.91), 
separamos as partes real e imaginária e escrevemos 


u(w) = 5 (t) cos wt dt, 
aaa (15.93) 
v(w) = -f D(t)sen wt dt, w>0. 
0 


Por essas expressões vemos que a parte real de y(w), u(w) é par, enquanto a parte imaginária de y(w), v(w) é 
ímpar: 


Compare esse resultado com o Exercício 15.3.1. 
Interpretando as Equações (15.93) como transformadas de Fourier de co-seno e seno, temos 


2 [e0] 
zy u(w) cos wt dw 
T Jo 
2 oO 
= -2 f v(w)sen wt dw, t>0. (15.94) 
0 


S(t) 


T 


Combinando as Equações (15.93) e (15.94), obtemos 


ou) =- [ sen TE u(w”) cosa tdo! | dt, (15.95) 
0 T Jo 


mostrando que, se nossa função transferência tiver uma parte real, ela terá também uma parte imaginária (e vice- 
versa). É claro que, com isso, admitimos que as transformadas de Fourier existem, assim excluindo casos como 
D(t)=1. 

A imposição de causalidade levou à interdependência mútua das partes real e imaginária da função transferência. 
O leitor deve comparar isso com os resultados da teoria da dispersão da Seção 7.2, que também envolve 
causalidade. 

Talvez seja útil mostrar que as propriedades de paridade de u(w) e v(w) requerem que P(t) desapareça para t 
negativo. Invertendo a Equação (15.87), temos 


D(t) E Ro [u(w) + iv(w)] [cos wt + isen wt] dw. (15.96) 


5j 


Com u(w) par e v(w) ímpar, a Equação (15.96) se torna 


E ici MD Ala 
D(t) = zJ u(w) cos wt dw — zf v(w)sen wt dw. (15.97) 
T Jo T Jo 
Pela Equação (15.94), 
u(w) cos wt dw = -f v(w)sen wtdw, t>0. (15.98) 
0 0 


Se invertermos o sinal de t, sen wt inverte o sinal e, pela Equação (15.97), 
D(t) = 0, t<0 


(o que demonstra a consistência interna de nossa análise). 
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Exercício 


15.7.1 Derive a convolução 


g(t) = a f(m)D(t — 7) dr. 


15.8 Transformadas de Laplace 
Definição 
A transformada de Laplace f(s) ou £ de uma função F(t) é definida por!! 


Hs) =L{F(t)} = lim F(A) a= f e~ F(t) dt. (15.99) 


a—00 0 


Aqui cabem alguns comentários sobre a existência da integral. A integral infinita de F(t), 


/ “r(d, 


não precisa existir. Por exemplo, F(t) pode divergir exponencialmente para t grande. Contudo, se houver alguma 
constante so, tal que 
[et F(t)| < M, (15.100) 


uma constante positiva para t suficientemente grande, t > to, a transformada de Laplace (Equação (15.99)) existirá 
para s > so; diz-se que F(t) é de ordem exponencial. Como contra-exemplo, F(t) = e” não satisfaz a condição 


dada pela Equação (15.100) e não é de ordem exponencial. Let} não existe. 
A transformada de Laplace também pode deixar de existir por causa de uma singularidade suficientemente forte 
na função F(t) quando t — 0, isto é, 
/ et dt 
0 


diverge na origem para n < —1. A transformada de Laplace L(t” } não existe para n < —1. 
Uma vez que, para duas funções F(t) e G(t), para as quais existem as integrais, 


Llar(t) + bG(t)| = aL{F(t)} +bL{G(t)}, (15.101) 
a operação denotada por £ é linear. 


Funções Elementares 
Para apresentar a transformada de Laplace, vamos aplicar a operação a algumas das funções elementares. Em todos 
os casos, admitimos que F(t) = 0, para t < 0. Se 


F()=1, t>0, 
então, 


a 1 
L{1} = / e dt = =F, para s > 0. (15.102) 
0 Ss 


Mais uma vez, seja 
F(t) = et, t>0. 


A transformada de Laplace se torna 
kt © Lst kt 1 
Lle e) eedt = —, para s > k. (15.103) 
0 s= k 
Usando essa relação, obtemos a transformada de Laplace de certas outras funções. Visto que 


1 1 
cosh kt = > (et +ett), senh kt = 3 (et — et, (15.104) 


HIsso às vezes é denominado transformada unilateral de Laplace; a integral de —oo to +00 é denominada transformada bilateral de 
Laplace. Alguns autores introduzem um fator adicional s. Esse s extra parece ter pouca vantagem e está sempre atrapalhando (compare com 
Jeffreys e Jeffreys, Seção 14.13; para comentários adicionais, veja as Leituras Adicionais). Em geral consideramos s real e positivo. É possível 
ter s complexo, contanto que R(s) > 0. 
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temos 


1 1 1 s 
L{cosh kt} = ta) =T 


(15.105) 
E E 1 1 1 o k 
Äi Co2ls-k s+k/ R? 
ambas válidas para s > k. Temos as relações 
cos kt = cosh ikt, sen kt = —isenh ikt. (15.106) 
Usando as Equações (15.105) com k no lugar de ik, constatamos que as transformadas de Laplace são 
s 
L{ cos kt} = ZLK?’ 
k (15.107) 
L{sen kt} = Zp 


ambas válidas para s > 0. Uma outra derivação dessa última transformada é dada na seção seguinte. Note que 
lims—o L{sen kt} = 1/k. A transformada de Laplace atribui um valor 1/k para lo sen kt dt. 


Por fim, para F(t) = t”, temos 

OO 

et) = e*t dt, 
0 
que é exatamente a função fatorial. Daí 
R n! 
Le pe Sn s>0,n>-1. (15.108) 

Note que em todas essas transformadas temos a variável s no denominador — potências negativas de s. 


Em particular, lim, oo f(s) = 0. A significância desse ponto é que, se f(s) envolver potências positivas de 
s (lims-oo f(s) — 00), então não existe nenhuma transformada inversa. 


N(t) 


e (ponto simples) 


Figura 15.7: Uma possível função nula. 


Transformada Inversa 
Essas operações têm pouca importância, a menos que possamos efetuar a transformada inversa, como nas 
transformadas de Fourier. Isto é, 


L{F(t)} = f(s), 
então, 
LH) = P(t). (15.109) 
Essa transformada inversa não é única. Duas funções Fi(t) e Fz(t) podem ter a mesma transformada, f(s). 


Contudo, nesse caso, 
In(t) — Fat) = N(t), 
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em que N (t) é uma função nula (Figura 15.7), indicando que 


to 
| N(t)dt=0, 
(0) 


para todo to. Esse resultado é conhecido como teorema de Lerch. Portanto, para o físico e o engenheiro, N (t) 
quase sempre pode ser considerada zero, e a operação inversa se torna única. 

A transformada inversa pode ser determinada de várias maneiras. (1) Pode-se montar uma tabela de 
transformadas e usá-la para efetuar a transformação inversa, exatamente como uma tábua de logaritmos pode 
ser usada para consultar antilogaritmos. As transformadas precedentes constituem o início de tal tabela. Se quiser 
um conjunto mais completo de transformadas de Laplace, veja a Tabela 15.2 (adiante) ou AMS-55, Capítulo 29 (a 
referência completa é dada na nota de rodapé 4 no Capítulo 5). Empregar expansões por frações parciais e vários 
teoremas operacionais, que são considerados em seções subsegiientes, facilita a utilização das tabelas. 


e Existe uma certa justificativa para suspeitar que essas tabelas têm mais valor para resolver exercícios propostos 
em livros didáticos do que para resolver problemas do mundo real. 

e Uma técnica geral para L7! será desenvolvida na Seção 15.12 usando o cálculo de resíduos. 

e Para as dificuldades e possibilidades de uma abordagem numérica — inversão numérica —, referimo-nos às 
Leituras Adicionais. 


Expansão por Frações Parciais 
A utilização de uma tabela de transformadas (ou transformadas inversas) é facilitada pela expansão de f(s) em 
frações parciais. 

Nossa transformada f(s) muitas vezes ocorre na forma g(s)/h(s), em que g(s) e h(s) são polinomiais sem 
nenhum fator comum, sendo g(s) de grau mais baixo do que h(s). Se os fatores de h(s) forem todos lineares e 
distintos, então, pelo método das frações parciais, podemos escrever 

ca C2 Cn 


f(s)= + ++ 
s— uq S— a2 S— dn 


(15.110) 


em que os c; são independentes de s. Os a; são as raízes de h(s). Se qualquer uma das raízes, por exemplo, a1, 
múltipla (ocorrendo m vezes), então f(s) tem a forma 


e Ci,m JE Ci,m—1 Moai C1,1 +5 Ci (15.111) 


(s—aı)™ (s—- amo s— a s— ai 


Por fim, se um dos fatores for quadrático, ( s? + ps + q), então o numerador, em vez de ser uma simples constante, 
terá a forma 
as +b 
s2 +ps+q 
Há várias maneiras de determinar as constantes introduzidas. Por exemplo, na Equação (15.110) podemos 
multiplicar tudo por (s — a;) e obter 
ci = lim (s — a;) f(s). (15.112) 


s>ai 


Em casos elementares, uma solução direta costuma ser a mais fácil. 


Exemplo 15.8.1 EXPANSÃO PARCIAL POR FRAÇÕES 
Seja 
k? c as+b 


f(s) = ea É + ar (15.113) 


Colocando o lado direito da Equação sobre um denominador comum e igualando potências iguais de s no 
numerador, obtemos 


k? ce(s? + k?) + s(as +b) 
s(s2 +k?) — s(s2 + k?) É 


(15.114) 
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Resolvendo essas expressões (s 2 0), temos 


o que resulta em 


1 s 
= - — 15.11 
OT (15.115) 
e 
LT! f(s)} = 1 — cos kt (15.116) 
pelas Equações (15.102) e (15.106). E 
Exemplo 15.8.2 Uma FUNCÃO DEGRAU 
Como aplicação de transformadas de Laplace, considere a avaliação de 
S t 
F(t) a im (15.117) 
0 x 


Suponha que consideramos a transformada de Laplace dessa integral definida (e imprópria): 


Be “nte ao = [ no CU edi. (15.118) 
0 T 0 0 T 


Agora, permutando a ordem de integração (o que é justificado), !? obtemos 


J — | e “sen tx at da = / o (15.119) 
o lo o $r? 


uma vez que o fator dentro das chaves é exatamente a transformada de Laplace de sen tx. Pelas tabelas de integrais, 


© da Lata x 
= tg” ES E À 15.120 
f 2+a2 59 (2), 2s Hs) ) 
Pela Equação (15.102) efetuamos a transformação inversa para obter 
T 
F(t) = z t>0, (15.121) 


de acordo com uma avaliação pelos cálculo de resíduos (Seção 7.1). Admitimos que t > 0 em F(t). Para F(—t), 
precisamos observar apenas que sen(—ta) = —sen tx, resultando em F(—t) = — F'(t). Por fim, se t = 0, F (0) é 
claramente zero. Por conseguinte, 


º sen tz T 2z HO 

J dr = z Put) -1]=4 0, t=0 (15.122) 
É ý É =S t<0 
2º : 


Note que h (sen tx/x)dz, considerada uma função de t, descreve uma função escalonada (Figura 15.8), um 
degrau de altura m em t = 0, o que é consistente com a Equação (1.174). E 


A técnica no exemplo precedente foi (1) introduzir uma segunda integração — a transformada de Laplace, (2) 
inverter a ordem de integração e (3) considerar a transformada inversa de Laplace. Há muitas oportunidades em 
que essa técnica de inverter a ordem de integração pode ser aplicada e já mostrou ser útil. O Exercício 15.8.6 é 
uma variação disso. 


2 veja, em Leituras Adicionais, Jeffreys e Jeffreys (1966), Capítulo 1 (convergência uniforme de integrais). 


ELSEVIER 
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Fo) 


vla 


Figura 15.8: F(t) = To sen te dx, uma função degrau. 


Exercícios 


15.8.1 


15.8.2 


15.8.3 


15.8.4 


15.8.5 


15.8.6 


15.8.7 


Prove que 
Jem s69) = Ji, 
Sugestão: Admita que F(t) pode ser expressa como F(t) = 5 ant”. 
Mostre que 
1 
— lim L{cos zt} = (x). 
T s>0 
Verifique que 
a? +, 


£ cosat — cosbt | s 
b — a? ~ (s2 +a?)(s2 452) 
Usando expansões por frações parciais, mostre que 


ti 1 o eteh 
(a) £ (mm l= ba ’ a + ob. 


ai s E ae — bet 
pa [am a—b : po: 


Usando expansões por frações parciais, mostre que, para a? Æ b2, 


cod 1 = 1 senat senbt 
Rr i (s2 +a?) (s2 +b) f|  a2-b a b J? 


2 
ai s = 1 = 
(b) £ i Erro) } =» {asen at — bsen bt}. 


Sabe-se que o potencial eletrostático de um disco condutor carregado tem a forma geral 
(coordenadas cilíndricas circulares) 


d(p,2) = f 7 eH Jolko) f(E) dk, 


sendo f(k) desconhecida. Em grandes distâncias (z — o0), o potencial deve se aproximar do 
potencial de Coulomb Q/4re£oz. Mostre que 


; q 
l k) = . 
lim fi ) ÅTE0 


Sugestão: Você pode fazer p = 0 e admitir uma expansão de Maclaurin de f(k) ou, usando e-*z, 


construir uma seqüência delta. 
Mostre que 
T 


© coss 
ds = 0 l, 
(8) | w 2(v — 1)! cos(vm/2)' Ad 


º sen s T 
b ds = 2 
(b) f eenean 
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Por que v é restrito a (0, 1) para (a) e (0,2) para (b)? Essas integrais podem ser interpretadas como 
transformadas de Fourier de s7” e como transformadas de Mellin de sen s e cos s. 

Sugestão: Substitua s”” por uma transformada integral de Laplace: L(t”"11/(v—1)!. Então integre 
em relação a s. A integral resultante pode ser tratada como uma função beta (Seção 8.4). 


15.8.8 Uma função F(t) pode ser expandida em uma série de potências (Maclaurin), isto é, 


FO 
n=0 
Então, 
tÁF(t)) = J EN ant’dt =X an f e*t dt. 
0 n=0 n=0 0 


Mostre que f(s), a transformada de Laplace de F( 
que s”!. Verifique seu resultado calculando L(ó(t 


t), não contém nenhuma potência de s maior do 
)+, o e comente. 
15.8.9 Mostre que a transformada de Laplace de M (a, c, x) é 
1 1 
LiM(a,c, x)} = -F ( a, 1;c,— ). 
s s 


15.9 Transformada de Laplace de Derivadas 
Talvez a principal aplicação de transformadas de Laplace seja na conversão de equações diferenciais em formas 
mais simples que podem ser resolvidas com maior facilidade. Veremos, por exemplo, que equações diferenciais 
acopladas com coeficientes constantes se transformam em equações algébricas lineares simultâneas. 

Vamos transformar a derivada de primeira ordem de F (t): 


L{F'(t)} = z gan q 


Integrando por partes, obtemos 


L{F'(t)} = er + f e~“ F(t)dt 
= sL{F(t)} — F(0). (15.123) 


Em termos estritos, F(0) = F(+0)!? e dF/dt deve ser ao menos contínua parte por parte para 0 < t < 
oo. Naturalmente, ambas, F(t) e sua derivada, devem ser tais que as integrais não divirjam. A propósito, a 
Equação (15.123) dá uma outra prova do Exercício 15.8.8. Uma extensão resulta em 


L{F®(t)} = L{F(t)} — sF(+0) — F'(+0), Gaa 
cr) = PLI F(t)} = st Lr(40) = e— FOW-D(40). (15.125) 


A transformada de Laplace, assim como a transformada de Fourier, substitui diferenciação por multiplicação. 
Nos exemplos seguintes, EDOs se tornam equações algébricas. É aqui que está o poder e a utilidade da 
transformada de Laplace. Mas veja o Exemplo 15.10.3 para saber o que pode acontecer se os coeficientes não 
forem constantes. 

Note como as condições iniciais, F(+0), F'(+0), e assim por diante, estão incorporadas na transformada. A 


Equação (15.124) pode ser usada para derivar L(sen kt}. Usamos a identidade 


2 


d 
—k2sen kt = qa” kt. (15.126) 


13 A aproximação de zero é pelo lado positivo. 
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Então, aplicando a operação da transformada de Laplace, temos 


d? 
2 o 
—k“L(sen kt) = ef gg” te) 
2 d 
= s“ L{sen kt) — ssen(0) — —sen kt| . (15.127) 
dt t=0 
Uma vez que sen(0) = 0 e d/dtsen kt|t=0 = k, 


k 


L{sen kt} = SER 


(15.128) 
o que verifica a Equação (15.107). 


Exemplo 15.9.1 OSCILADOR HARMÔNICO SIMPLES 
Como exemplo físico, considere uma massa m oscilando sob a influência de uma mola ideal, constante de mola k. 


Como sempre, desprezamos o atrito. Então, a segunda lei de Newton se torna 
dX(t) 
dt? 


+kX(t) = 0; (15.129) 
além disso, consideramos as condições ideais 
X(0) = Xo, X'(0) = 0. 


Aplicando a transformada de Laplace, obtemos 
d2X 
melo | +kL{X(t)} =0, (15.130) 


e, usando a Equação (15.124), essa expressão se torna 


ms2x(s) — msXo + kz(s) = 0, (15.131) 
S 


ER 15.132 
T (15.132) 


a(s) = Xo com wå = 


3 |» 


Pela Equação (15.107) vemos que essa é a transformada de cos wot, que resulta em 
X(t) = Xo cos wot, (15.133) 
como esperado. E 


Exemplo 15.9.2  NuUTAaÇÃO DA TERRA 


Um exemplo um pouco mais complicado é a nutação dos pólos da Terra (precessão livre de força). Se tratarmos a 
Terra como um esferóide (oblato) rígido, as equações de movimento de Euler se reduzem a 
dX dY 
— = aY. — = +aX 15.134 
Ji ar, E TAA ( ) 


em que a = |(I; — Is) /-]wz, X = wz, Y = wy com vetor de velocidade angular w = (wg, Wwy, wz) (Figura 15.9), 
I, = momento de inércia em torno do eixo z e I} = 1, momento de inércia em torno do eixo x (ou y). O eixo z 
coincide com o eixo de simetria da Terra. A diferença entre o eixo de simetria e o eixo de rotação diária da Terra, 
w, é de cerca de 15 metros, medida nos pólos. A transformação dessas equações diferenciais acopladas resulta em 


sz(s)— X(0) = —ay(s), sy(s) — Y (0) = ax(s). (15.135) 
Combinados para eliminar y(s), temos 


s2x(s) — sX(0) + aY (0) = —a2x(s), 
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o 
(wp 0) 
X 
x y 
Figura 15.9: 
ou E 7 
g(s) = X(0) 5,73 o YOz (15.136) 
Daí, 
X(t) = X (0) cosat — Y (0)sen at. (15.137) 
De modo semelhante, 
Y (t) = X(0)sen at + Y (0) cos at. (15.138) 


Essa expressão é considerada a rotação do vetor (X, Y) em sentido anti-horário (para a a > 0) em torno do eixo z 
com ângulo 6 = at e velocidade angular a. 
Podemos encontrar uma interpretação direta escolhendo o eixo de tempo, de modo que Y (0) = 0. Então, 


X(t) = X(0) cosat, Y(t) = X(0)sen at, (15.139) 


que são as equações paramétricas para rotação de (X, Y) em uma órbita circular de raio X(0), com velocidade 
angular a no sentido anti-horário. 

No caso da velocidade angular da Terra, o vetor X (0) é de cerca de 15 metros, enquanto a, como definida aqui, 
corresponde a um período (27 /a) de cerca de 300 dias. Na verdade, por causa dos desvios em relação ao corpo 
rígido idealizado que admitimos ao estabelecer as equações de Euler, o período é de aproximadamente 427 dias.!4 
Se na Equação (15.134) fizermos 


XH =La YO=L 


Siy, 
em que L, e Ly são as componentes x e y do momento angular L, a = —gz Bz, gL é a razão giromagnética e B, 
é o campo magnético (ao longo do eixo z), então a Equação (15.134) descreve a precessão de Larmor de corpos 
carregados em um campo magnético uniforme B,. E 


Função Delta de Dirac 


Há mais uma outra transformada que é útil para usar com equações diferenciais — a função delta de Dirac:!º 


Lló(t— to)) > e“ s(t— to) dt = e7, para to > 0, (15.140) 
0 


14D, Menzel, ed., Fundamental Formulas of Physics, Englewood Cliffs, NJ: Prentice-Hall (1955), nova tiragem, 2 ed., Dover (1960), p. 695. 
15Em termos estritos, a função delta de Dirac é indefinida. Contudo, a integral sobre ela é definida. Essa abordagem é desenvolvida na Seção 
1.16 usando seqiiências delta. 
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e para to = 0 
cit =1, (15.141) 


em que se admite que estamos usando uma representação da função delta, tal que 
j ôlt)dt=1, ô(t) = 0, para t > 0. (15.142) 
0 


Como método alternativo, ó(t) pode ser considerada o limite quando £ — 0 de F(t), 


0, t<o, 
F(t)=4 l, O0<t<e, (15.143) 
0, t>e. 
Por cálculo direto, 
1-eT*s 
ciFr()) = a (15.144) 


Considerando o limite da integral (em vez da integral do limite), temos 
lim L{F()} =1, 


ou Equação (15.141), 

L{6(t)}=1. 
Essa função delta costuma ser denominada função impulso porque é muito útil para descrever forças impulsivas, 
isto é, forças que duram somente por um intervalo de tempo muito curto. 


Exemplo 15.9.3 FORÇA IMPULSIVA 
A segunda lei de Newton para força impulsiva agindo sobre uma partícula de massa m se torna 


d2X 
my - Pô(t), (15.145) 
em que P é uma constante. Transformando, obtemos 
ms2x(s) — msX (0) — mX’ (0) = P. (15.146) 


Para uma partícula que parte do repouso, X’ (0) = 0.!º Também consideraremos X (0) = 0. Então, 


P 
z(s) = e (15.147) 
ms 
e 
P 
O (15.148) 
m 
dX(t P 
dX(t) = uma constante. (15.149) 
dt m 


O efeito do impulso Pó(t) é transferir (instantaneamente) P unidades de momento linear à partícula. 

Uma análise semelhante se aplica ao galvanômetro balístico. O torque no galvanômetro é dado inicialmente por 
kı, no qual ų é um pulso de corrente e k é uma constante de proporcionalidade. Uma vez que + tem curta duração, 
fazemos 


kı = kq ó(t), (15.150) 
em que q é a carga total carregada pela corrente 1. Então, sendo 7 o momento de inércia, 
d20 
I— = kg ó(t 15.151 
qe 7 ta C), ( ) 
e, transformando como antes, constatamos que o efeito do pulso de corrente é uma transferência de kq unidades 
de momento angular ao galvanômetro. E 


!óTsso deveria ser X!(+0). Para incluir o efeito do impulso, considere que o impulso ocorrerá em t = e e faça € — 0. 
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Figura 15.10: Mola. 
Exercícios 
15.9.1 Use a expressão para a transformada de uma derivada de segunda ordem para obter a transformada 
de cos kt. 
15.9.2 Uma massa m está ligada a uma extremidade de uma mola não-estendida, com constante de mola 
k (Figura 15.10). No tempo t = 0 a extremidade livre da mola sofre uma aceleração constante a, 
longe da massa. Usando transformadas de Laplace, 
(a) Ache a posição x de m como uma função do tempo. 
(b) Determine a forma limite de z(t) para t pequeno. 
1 k 
Resposta: (a) £ = 50 — 5a — coswt), w? = mi) 
2 
(b) x = ad wt<1 
15.9.3 Núcleos radioativos se desintegram segundo a lei 
daN 
-RRAN 
dt i 


sendo N a concentração de um dado nuclídeo e À a constante de desintegração particular. Essa 
equação pode ser interpretada como uma afirmação de que a taxa de desintegração é proporcional 
ao número desses núcleos radiotivos presentes. Todos eles se desintegram independentemente. 

Em uma série radioativa de n nuclídeos diferentes, iniciando com N4, 


dN, 

Ed 

dt ISI; 

dN. 

r = AN, — à2N9, e assim por diante. 

dN, 

E = àn—-1Nn-1, estável. 
Ache Nı (t), No(t), N3(t), n = 3, com Nı (0) = No, No(0) = Na(0) = 0. 

À 
Resposta: Ni(t) = Noe™™t, No(t) = No (€ Mt — een), 
As — À 
Ao —Mt Ai —Aot 
Na(t) = No(1- tp A emt), 
3(t) o( O Pao 


Ache uma expressão aproximada para No e Ns, válida para t pequeno quando À; = As. 
N 
Resposta: Nə = Noàıt, Nym FAAP. 


Ache expressões aproximadas para N5 e N3, válidas para t grande, quando 


(a) À > As, 
(b) À < As. 
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Resposta: (a) Na = Nçe” 2º, 
Ns = No(1- e“), At>l. 
b) No = Note ™t, 


Ns = No(1- MD, At>l. 
15.9.4 A formação de um isótopo em um reator nuclear é dada por 
dNo 


dE = nvo Nio se Ao No(t) = nvosNo(t). 


Aqui, o produto nv é o fluxo de nêutrons, nêutrons por centímetro cúbico vezes centímetros por 

segundo significa velocidade; c1 e o2 (cm?) são medidas da probabilidade de absorção de nêutrons 

pelo isótopo original, concentração N10, que admitimos constante, e do isótopo recentemente 

formado, concentração N2, respectivamente. A constante de desintegração radioativa para o isótopo 

é Ao. 

(a) Ache a concentração Na do novo isótopo como uma função do tempo. 

(b) Se o elemento original for Eu!53, 9, = 400 barns = 400 x 10724 em?2, o» = 1.000 barns = 
1.000 x 10-24 cm2, e A» = 1,4 x 107? s71, Se No = 10% e (nv) = 10º cm 2s”!, ache 
No, a concentração de Eu! após um ano de irradiação contínua. Justifica-se supor que N; é 


constante? 


15.9.5 Em um reator nuclear, Xe!%º é formado como produto direto de fissão e também como um produto 


da desintegração de I!35, tempo de meia-vida de 6,7 horas. A meia-vida do Xe!3º é de 9,2 horas. 
Como o Xe!% absorve fortemente nêutrons térmicos e por isso “envenena” o reator nuclear, sua 
concentração é uma questão de grande interesse. As equações relevantes são 


dN 

Pa = Yrgo s Nu Er AINI, 

dN 

a = ArNr + yxyofNuy — àx Nx — yox Nx. 


Aqui, Ny = concentração de I!35 (Xet35, U?35), Admita que 


Ny = constante, 
yr = produção de 13º por fissão = 0, 060, 
yy = produção de Xe!35 diretamente da fissão = 0, 003, 
Ar = I?” (Xe!85) constante de desintegração = Bag Ea 
ti/2 t1/2 
of = seção de choque de fissão de nêutron térmico para U?35, 


ox = seção de choque de absorção de nêutron térmico para Xe! 


= 3,5 x 10º barns = 3,5 x 10718 cm?. 


(ar, seção de choque de absorção de 1135 


, é desprezível.) 


y = fluxo de nêutrons = nêutrons Jem? x velocidade média (cm/s). 


(a) Ache Ny (t) em termos de fluxo de nêutrons «p e do produto o Nu. 

(b) Ache Nx (t — 00). 

(c) Após Nx ter alcançado o equilíbrio, o reator é paralisado, y = 0. Ache Nx(t) após a 
paralisação. Note o aumento em Nx, que pode, durante algumas horas, interferir com a nova 
partida do reator. 


15.10 Outras Propriedades 
Substituição 


Se substituirmos o parâmetro s por s — a na definição da transformada de Laplace (Equação (15.99)), teremos 


f(s-a)= f pi e750) F(t) dt = / o eStest F(t) dt 
0 0 
= Ele: (15.152) 
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Por conseguinte, a substituição de s por s — a corresponde a multiplicar F(t) por eº* e vice-versa. Esse resultado 
pode ser usado com vantagem para ampliar nossa tabela de transformadas. Pela Equação (15.107), constatamos 
imediatamente que 


A k 
Lfe“'sen kt} = ls- a)? Fk? (15.153) 
além disso, 
Lle“'cos kt} apoo s>a. 
(s— a)? +k?’ 


Exemplo 15.10.1 OSCILADOR ATENUADO 


Essas expressões são úteis quando consideramos uma massa oscilatória com atenuação proporcional à velocidade. 
A Equação (15.129), à qual foi adicionada essa atenuação, se torna 


MX” (t) +bX' (t) +kX(t)=0, (15.154) 


na qual b é uma constante de proporcionalidade. Vamos admitir que a partícula parta do repouso em X (0) = Xo, 
X’ (0) = 0. A equação transformada é 


m[s2x(s) — sXo] + b[sz(s) — Xo] + ka(s) = 0, (15.155) 
i b 
ms + 
= Xý. 15.156 
AP ms? + bs + k ( ) 
Essa expressão pode ser manipulada completando o quadrado do denominador: 
b k b\? (k v 
+ —s+—>=|s+—) +[>=>]. (15.157) 
m m 2m m 4m? 
Se a atenuação for pequena, b? < 4 km, o último termo é positivo e será denotado por w?: 
s+b/m 
=X 
el) 5 (s + b/2m)? + w? 
s+b/2m (b/2mw1)w1 
=X X À 15.158 
0 [s +b/2m)? +w? ii O(s + b/2m)? + w2 ( ) 
Pela Equação (15.153), 
b 
X(t) = Xoe 0/2mt (cos wait + sen ont) 
2mw1 
= Xo Le tm cos(wrt — q), (15.159) 
wi 
em que 
k 
tgp = E 
IP 2mw” “o m 
É claro que, à medida que b — 0, essa solução passa para a solução não-atenuada (Seção 15.9). E 
Analogia com RLC 


Vale a pena notar a similaridade entre essa oscilação harmônica simples atenuada de uma massa em uma mola e um 
circuito RLC (resistência, indutância e capacitância), (Figura 15.11). Em qualquer instante, a soma das diferenças 
de potencial ao redor do circuito deve ser zero (lei de Kirchhof, conservação de energia). Isso resulta em 


me A Idt=0. (15.160) 
Diferenciando a corrente 7 em relação ao tempo (para eliminar a integral), temos 
d2T dl 1 
pes R—+>[=0. 15.161 
ae ttato Erro) 
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L 
Figura 15.11: Circuito RLC. 
Se substituirmos T(t) por X (t), L por m, R por be C7} por k, então a Equação (15.161) é idêntica ao problema 


mecânico. Esse é apenas um exemplo da unificação de diversos ramos da Física pela Matemática. Uma discussão 
mais completa será encontrada no livro de Olson.!” 


Translação 


Desta vez, seja f(s) multiplicada por e7™®, b > 0: 


es f(s) = ee e“ F(t)dt 
(0) 
=[ est) F(t) dt. (15.162) 
(0) 


Agora, seja t + b = 7. A Equação (15.162) se torna 
e™®™ f(s) = / e F(T — b) dr 
b 
= / e F(T — b)u(r — b) dr, (15.163) 
0 


em que u(r — b) é a função degrau unitária. Essa relação costuma ser denominada teorema do deslocamento de 
Heaviside (Figura 15.12). 


FA 


Figura 15.12: Translação. 


Visto que admitimos que F(t) é igual a zero para t < 0, F(T — b) = 0, para 0 < 7 < b. Por conseguinte, 
podemos estender o limite inferior para zero sem mudar o valor da integral. Então, observando quet 7 é somente 
uma variável de integração, obtemos 

e™ f(s) = L{F(t—b)}. (15.164) 


1H, F. Olson, Dynamical Analogies, Nova York: Van Nostrand (1943). 
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Exemplo 15.10.2 ONDAS ELETROMAGNÉTICAS 


A equação de onda eletromagnética, sendo E = E, ou E,, uma onda transversal que se propaga ao longo do eixo 
x, é 


oEle,t) 1 92E(x,t) 


= 0. 15.1 
da? v2 Ot j n 
Transformando essa equação em relação a t, obtemos 
o? 8? s 1 E(x, t) 
sl E(z,t)} — — Li E(z,t =E S— = 0. 15.1 
TERA (2,6) 1 aLi (at) + z (2,0) + 7d lo 0 (15.166) 
Se tivermos a condição inicial E(x,0) = 0 e 
0E(a,t) 
=0, 
ðt fio 
então, 
9? s? 
Do Ela, t)) = a LAE, t}. (15.167) 
A solução (dessa EDO) é 
L E(x, t)} = cre les 4 coetleiva, (15.168) 


As “constantes” cy e c2 são obtidas por condições de contorno adicionais. Elas são constantes em relação a x mas 
podem depender de s. Se nossa onda permanecer finita quando x — œ, L{ E(x, t)}, também permanecerá finita. 
Por conseguinte, c2 = 0. Se E(0, t) for denotada por F(t), então c1 = f(s) e 


Li E(a,t)) = e (6/02 f(s). (15.169) 
Pela propriedade da translação (Equação (15.164)), constatamos imediatamente que 
F(t-5), o tay 
E(x,t) = (15.170) 
0, bes 


Diferenciação e substituição na Equação (15.165) verifica a Equação (15.170). Nossa solução representa uma onda 
(ou pulso) que se move na direção positiva x com velocidade v. Note que para x > vt, a região permanece não- 
perturbada; o pulso não teve tempo de chegar lá. Se quiséssemos que o sinal se propagasse ao longo do eixo x 
negativo, cy teria de ser igualado a O e nós teríamos obtido 


PO. MES 
laio 0 t<— 


zi 


(15.171) 


uma onda ao longo do eixo x negativo. E 
Derivada de uma Transformada 


Quando F(t), que é, no mínimo, contínua parte por parte, e s são escolhidos, de modo que es" F(t) converge 
exponencialmente para s grande, a integral 
oO 
I est r(t) dt 
0 


é uniformemente convergente e pode ser diferenciada (sob o sinal de integral) em relação a s. Então, 


Pie f oere dt = L{—tF(t)}. (15.172) 
0 
Continuando esse processo, obtemos 
f (8) = L{ (H P(t)). (15.173) 


Todas as integrais obtidas dessa maneira serão uniformemente convergentes por causa do comportamento 
exponencial decrescente de e7®* F (t). 
Essa mesma técnica pode ser aplicada para gerar mais transformadas. Por exemplo, 


i 1 
Let) sf e7teăt dt = PT. s>k. (15.174) 
E = 
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Diferenciando em relação a s (ou em relação a k), obtemos 


1 
Lfte*t) = EO s>k. (15.175) 
Exemplo 15.10.3 Equação DE BESSEL 


Uma aplicação interessante de uma transformada de Laplace diferenciada aparece na solução da equação de Bessel 
com n = 0. Pelo Capítulo 11, temos 


2y" (x) + ey (x) + 2y(e) = 0. (15.176) 


Dividindo por x e substituindo t = x e F(t) = y(x) para ficar de acordo com a presente notação, vemos que a 
equação de Bessel se torna 
tF” (t) + F'(t)+tF(t)=0. (15.177) 


Precisamos de uma solução regular, em particular, F(0) = 1. 1. Pela Equação (15.177), com t = 0, F'(+0) = 
0. Além disso, admitimos que nossa F(t) desconhecida tem uma transformada. Transformando e usando as 
Equações (15.123), (15.124) e (15.172), temos 


d 


n [82 f(s) — s] + sf(s) 1 — PAG) =0. (15.178) 
Rearranjando a Equação (15.178), obtemos 
(2 +Df(s)+sf(s)=0, (15.179) 
ou 
g z e (15.180) 
uma EDO de primeira ordem. Por integração, 
In f(s) = -4 In(s? +1) +InC, (15.181) 
que pode ser reescrita como E 
f(s) = Je T (15.182) 


Para fazer uso da Equação (15.108), expandimos f(s) em uma série de potências negativas de s, convergente para 
s>l: 


S s2 
C 1 1-3 (1 (2n)! 
= ... 1 4 
s | 282 922.954 (2rnl)252m (15.183) 
Invertendo termo a termo, obtemos 
eo (—1)”?” 
PUS A ame 15.184 
g A (2”n!)? ( ) 


Quando igualamos C a 1, como requer a condição inicial F (0) = 1, F(t) é exatamente Jo(t), nossa familiar 
função de Bessel de ordem zero. Por conseguinte, 


1 
LiJo(t)p= =. 15.185 
(O) = -A (15.185) 
Note que admitimos s > 1. Deixamos a prova para s > 0 como problema. 
Vale a pena observar que essa aplicação foi bem-sucedida e relativamente fácil porque consideramos n = 0 na 
equação de Bessel. Isso possibilitou dividir um fator de x (ou t). Se não tivéssemos feito isso, os termos da forma 
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t? F(t) teriam introduzido uma derivada de segunda ordem de f(s). A equação resultante não teria sido mais fácil 
de resolver do que a original. 

Quando passamos das EDOs lineares com coeficientes constantes, a transformada de Laplace ainda pode ser 
aplicada, mas não há garantia de que essa aplicação será proveitosa. 

A aplicação à equação de Bessel, n 0), será encontrada nas referências. Como alternativa, podemos mostrar 


que 
—n 2 Dis n 
L{ Jnlat)} = É CORT (15.186) 
(EFE 
expressando J, (t) como uma série infinita e transformando termo a termo. E 


Integração de Transformadas 
Novamente, sendo F(t) no mínimo contínua parte por parte e x grande o suficiente para que e?! F (t) decresça 
exponencialmente (quando x — oc), a integral 


f(x) = ni e™™ F(t) dt (15.187) 


é uniformemente convergente em relação a x. Isso justifica inverter a ordem de integração na seguinte equação: 


f to dz = f d f dte ™™ F(t) 
(t) 


- [ DO (em — et) dt, (15.188) 


na integração com relação a x. Escolhemos o limite inferior s grande o suficiente para que f(s) esteja dentro da 
região de convergência uniforme. Agora, deixando b — oo, temos 


/ fa) wef PO e-ta = ef TO), (15.189) 


contanto que F'(t)/t seja finita em t = 0 ou divirja com menos força do que t” ! (de modo que L{ F (t) /t} existirá). 


Limites de Integração — Função Escalonada Unitária 


Os limites de integração reais para a transformada de Laplace podem ser especificados com a função degrau unitária 
(Heaviside) 

0, t<k 

1, t>k. 


ut- =] 


Por exemplo, 


L{ult— k)) =f edi = e, 


Um pulso retangular de largura k e altura unitária é descrito por F(t) = u(t) — u(t — k). Considerando a 
transformada de Laplace, obtemos 


k 
1 
L{u(t)— u(t — k)} = / e7 dt = = (1 — e™°). 
0 s 
A função degrau unitária também é usada na Equação (15.163) e poderia ser invocada no Exercício 15.10.13. 


Exercícios 
15.10.1 Resolva a Equação (15.154), que descreve um oscilador harmônico simples atenuado para X (0) = 
Xo, X'(0)=0e 
(a) b? = 4 km (criticamente atenuado), 
(b) b? > 4 km (superatenuado). 


Resposta: (a) X(t) = Xoe7 ®/2m)t (1 ER zt) 
m 
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15.10.2 Resolva a Equação (15.154), que descreve um oscilador harmônico simples atenuado para X(0) = 
0, X'(0) = v0 e 
(a) b? < 4 km (subatenuado), 
(b) b? = 4 km (criticamente atenuado), 
(c) b? > 4 km (superatenuado). 


Resposta: (a) X(t) = Do e= (/2m)tsen wt, 


w1 
(b) X(t) = vote” ®t, 


Figura 15.13: Circuito de toque de campainha. 


15.10.3 O movimento de um corpo em queda em um meio resistente pode ser descrito por 


dX(t) dX(t) 
qem UI Ear 


quando a força de retardo é proporcional à velocidade. Ache X (t) e dX(t)/dt para as condições 
iniciais E 
X(0) = — 
= 


15.10.4 Circuito de toque de campainha. Em certos circuitos eletrônicos, resistência, indutância e 
capacitância são montadas em paralelo na placa de circuito (Figura 15.13). Uma voltagem constante 
é mantida nos elementos paralelos conservando o capacitor carregado. No tempo t = 0, o circuito é 
desconectado da fonte de voltagem. Ache as voltagens através dos elementos R, L e C como uma 
função do tempo. Admita que R é grande. 
Sugestão: Pelas leis de Kirchhoff, 


=. 
t=0 


Ir+Ilc+I,=0 e Er = Ec = Es, 


em que 


qo 1 ř 
Poc Ayi ledt 
c->cTto / c 
qo = carga inicial do capacitor. 
Com a impedância DC de L = 0, faça Iz (0) = To, EL (0) = 0. Isso significa que qo = 0. 


15.10.5 Expressando Jo(t) como uma integral de contorno, aplique a operação de transformada de Laplace, 
inverta a ordem de integração e, assim, mostre que 


L(Jo(t)) = (5º + ae para s > 0. 
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15.10.6 Desenvolva a transformada de Laplace de J„(t) a partir de L(Jo(t)) usando as relações de 
recorrência da função de Bessel. 
Sugestão: Essa é uma chance de usar indução matemática. 
15.10.7 Um cálculo do campo magnético de um circuito de corrente circular em coordenadas cilíndricas 
circulares leva à integral 
| e *2kJi(ka) dk, R(z) > 0. 
0 
Mostre que essa integral é igual a a/(22 + a2)3/2. 
15.10.8 O potencial eletrostático de uma carga pontual q na origem em coordenadas cilíndricas circulares é 
Es = q 1 
Jo(kp) dk = : R(z) > 0. 
a) E AERIS i F A (2) 2 
Por essa relação, mostre que as transformadas de Fourier de co-seno e seno de Jo(kp) são 
= oo 2_ +2 —1/2 
a) 1| Z FA J(k = [ Sho stored: (O =0) O pol 
(à SE olho) = f Jolko) coske E na 
T Ra 0, p> Ç, 
(b) 4/ =F: Jolkp)} = / Jo(kp)sen k¢ dk = -1/2 
V2 t } o pr QI PS. pe 
Sugestão: Substitua z por z + iÇ e considere o limite quando z — 0. 
15.10.9 Mostre que 
LlJo(at)) = (° — e s>a. 
15.10.10 Verifique as seguintes transformadas de Laplace: 
sen at 1 s 
jo(at) + = = =cotg ! — 
(a) L{ jola )} ef r } qe0tg (=). 
(b) Lino(at)) não existe, 
hat 1 1 
(o) Lliolat)y = £ senhat) _ nêt’ cotgh™! = l 
at 2a s—a a a 
(d) L{kolat)} não existe. 
15.10.11 Desenvolva uma solução de transformada de Laplace da equação de Laguerre 
tF" (t) + (1 -—t)F'(t)+nF(t)=0. 
Note que você precisa de uma derivada de uma transformada e de uma transformada de derivadas. 
Vá até onde puder com n; então (e só então) faça n = 0. 
15.10.12 Mostre que a transformada de Laplace do polinômio de Laguerre Ln (at) é dada por 
(s— a)" 
15.10.13 Mostre que 
1 
ciEei(t)) = —In(s+1), s>0, 
s 
em que 
o ,—T oo ,—at 
E(t) = f dr= i f de. 
t T 1 T 
E(t) é a função integral exponencial. 
15.10.14 (a) Pela Equação (15.189), mostre que 


I tadas | Ou, 


contanto que as integrais existam. 
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F(t) 
4 


a 2a 3a 


Figura 15.14: Função periódica. 


(b) Pelo resultado precedente, mostre que 


de acordo com as Equações (15.122) e (7.56). 


15.10.15 (a) Mostre que 
kt 


(b) Usando esse resultado (com k = 1), prove que 


1 
L{si(t)} = —-tg”!'s, 
s 
em que 
si(t) = -f o, a integral de seno. 
t 
15.10.16 Se F(t) for periódica (Figura 15.14) com um período a, de modo queF (t + a) = F(t) para todo 
t > 0, mostre que 
fo TF, dt 
o 1-e-98 


ro) 


agora com a integração somente sobre o primeiro período de F(t). 


al 


15.10.17 Ache a transformada de Laplace da onda quadrada (período a) definida por 


1, 0<t< $ 
F(t) = á 
0, 5<t<a. 


v | = 
H 
MD 
I 
Q 
KA 
a 
N 


Resposta: f(s) = 
15.10.18 Mostre que 


s3 as? — 2a? 
(a) Lfcoshatcosat) = SAR (c) Lfsenhatcosat) = Ea 
21902 2a? 
(b) Lfcoshatsen at) = E (d) Lfsenhatsen at! = o 
15.10.19 Mostre que 
2 1 1 
(a) LTH (8? + a?) 4 = zg” at — zaz COS at, 


(b) LTH s(s? + a?) ’} = tsen at, 


-IS2(2 2-2 a cade 1 , 
© L fs (s +a’) p= zgn at + zt cos at, 


(d) LTH sè (s? + me = cosat — tsen at. 
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15.10.20 Mostre que 
ce — k?) "Pult — k)} = Ko(ks). 
Sugestão: Tente transformar uma representação integral de Ko(ks) na integral transformada de 
Laplace. 
15.10.21 A transformada de Laplace 


S 


/ e “axJo(a) da = CESE 


a, u(i E CEEA 


que está na forma de quadratura de Gauss-Laguerre. Avalie essa integral para s = 1,0, 0,9,0,8, 

. , decrescendo em etapas de 0,1 até que o erro relativo alcance 10%. (O efeito do decréscimo de s 
é fazer com que o integrando oscile mais rapidamente por unidade de comprimento de y, reduzindo 
assim a precisão da quadratura numérica.) 


15.10.22 (a) Avalie 


pode ser reescrita como 


J e *2kJi(ka) dk 
0 


pela quadratura de Gauss-Laguerre. Considere a = 1 e z = 0, 1(0, 1)1, 0. 
(b) Pela forma analítica, Exercício 15.10.7, calcule o erro absoluto e o erro relativo. 


Z 
(a, a) 


Sed 


a Ts 0) i (a, 0) 


Figura 15.15: Troca de variáveis, (a) plano xy, (b) plano zt. 


15.11 Teorema da Convolução (“Faltungs”) 


Uma das propriedades mais importantes da transformada de Laplace é a dada pelo teorema da convolução, ou 
dobraduras.!8 Considerando duas transformadas, 


fils) =L{FRA} e fals) =L{F(t)}, (15.190) 


e as multiplicamos. Para evitar complicações na troca de variáveis, mantemos os limites superiores finitos: 


fails) fo(s) = lim f e F(x) daf e Fo (y) dy. (15.191) 
a> Jo 0 


Os limites superiores são escolhidos de modo que a área de integração, mostrada na Figura 15.15a, seja o triângulo 
sombreado, e não o quadrado. Se integrarmos sobre um quadrado no plano xy, teremos um paralelogramo no plano 
tz, o que só serve para complicar. Essa modificação é permissível porque admitimos que integrandos decrescem 
exponencialmente. No limite a — oo, uma integral sobre o triângulo não-sombreado dará contribuição zero. 


18Uma derivação alternativa emprega a integral de Bromwich (Seção 15.12). Esse é o Exercício 15.12.3. 
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Substituindo x = t — z, y = z, a região de integração é mapeada para o triângulo mostrado na Figura 15.15b. Para 
verificar o mapeamento, mapeie os vértices: t = x + y, z = y. Usando jacobianos para transformar o elemento de 
área, temos 


ds dy 
ld dt 11 0 
da dy = or oy dt dz =| ne [atas (15.192) 
Oz Oz 


ou dx dy = dt dz. Com essa substituição, a Equação (15.191) se torna 


a—00 


fals) f2(s) = lim i em [nt — z)Fo(2) dz dt 
= a F(t- 2)Fa(2) deb (15.193) 


Por conveniência, essa integral é representada pelo símbolo 
t 
/ Fdlt— z)Fo(z) dz = F * F> (15.194) 
0 


e denominada convolução, guardando estreita analogia com a convolução, de Fourier (Seção 15.5). Se 


substituirmos w = t — z, encontraremos 
Fi x Fo = Fo * F), (15.195) 


que mostra que a relação é simétrica. 
Efetuando a transformada inversa, também encontramos 


Haara = | F(t — 2)Fo(2) dz. (15.196) 


Isso pode ser útil no desenvolvimento de novas transformadas ou como uma alternativa a uma expansão por frações 
parciais. Uma aplicação imediata é na solução de equações integrais (Seção 16.2). Uma vez que o limite superior, 
t, é variável, essa convolução de Laplace é útil no tratamento de equações integrais de Volterra. A convolução de 
Fourier com limites fixos (infinitos) se aplicaria a equações integrais de Fredholm. 


Exemplo 15.11.1 OSCILADOR FORÇADO COM ATENUAÇÃO 
Como ilustração da utilização do teorema da convolução, vamos voltar à massa m presa a uma mola, com atenuação 
e uma força propulsora F(t). A Equação de movimento (15.129) ou (15.154) agora se torna 


mX"(t) + 0X'(t) + kX(t) = F(t). (15.197) 
São usadas condições iniciais X(0) = 0, X'(0) = 0 para simplificar essa ilustração, e a equação transformada é 

ms?x(s) + bs x(s) + kr(s) = f(s), (15.198) 
ou 


FS) 1 
x(s) = m T Ro (15.199) 


em que w? = k/m — b2/4m?, como antes. 
Pelo teorema da convolução (Equações (15.193) ou (15.196)), 


1 t 
X(t) = J F(t — zje ®/2™sen wz dz. (15.200) 
Mw1 Jo 
Se a força for impulsiva, F(t) = Pó(t),!? 
P —(b/2m)t 
X(t) = —e sen wt. (15.201) 


MW 


Note que d(t) está dentro do intervalo [0, t]. 
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P representa o momentum transferido pelo impulso, e a constante P/m assume o lugar de uma velocidade inicial 
X'(0). 
Se F(t) = Fosen wt, Equação (15.200), a Equação (15.200) pode ser usada, mas uma expansão por frações 


parciais talvez seja mais conveniente. Com 
Fow 
(OS apap 
a Equação (15.199) se torna 
Fow 1 1 
m s+w2 (s+b/2m) +w? 
— Fwlas+b E c's+d' 
= s2 +w? (s+b/2m) +w?| 


(15.202) 


m 


Os coeficientes a’, b', c’ e d’ são independentes de s. Um cálculo direto mostra 


1 b m 2 

a 24 5 2 w?) , 

! = T (w? w?) eran w?) 
bo pes m b o Í 


Uma vez que c' e d' levarão a termos exponencialmente decrescentes (transientes), eles serão descartados aqui. 
Efetuando a operação inversa, encontramos para a solução de estado estável 

Fo 
bw? + mw — w2)2]1/2 


X(t) = sen(wt — p), (15.203) 


em que 


a mw — w?) 


b? b? 
w? = wi — r = wi — a. (15.204) 


Essa é a condição de ressonância, 2º Em ressonância, a amplitude se torna Fy /bw1, mostrando que a massa m entra 
em oscilação infinita em ressonância se desprezarmos a atenuação (b = 0). Vale a pena observar que temos três 


frequências características diferentes: 
2 
w? = wê — Ru 
2 0 2m2’ 


ressonância para oscilações forçadas, com atenuação; 


freqüência de oscilação livre, com atenuação; e 


k 
di=e 
m 


? 


frequência de oscilação livre, sem atenuação. Elas coincidem se a atenuação for zero. E 


Voltando às Equações (15.197) e (15.199), a Equação (15.197) é nossa EDO para a resposta de um sistema 
dinâmico a uma força propulsora arbitrária. A resposta final depende claramente da força propulsora, bem 
como das características de nosso sistema. Essa dependência dual é separada no espaço da transformada. Na 
Equação (15.199), a transformada da resposta (saída) aparece como o produto de dois fatores: um que descreve a 
força propulsora (entrada) e o outro que descreve o sistema dinâmico. Essa última parte, que modifica a entrada e 
resulta na saída, costuma ser denominada função transferência. Especificamente, [(s+b/2m)2+w2]"! é a função 
transferência correspondente a esse oscilador atenuado. O conceito de função transferência é de grande utilidade 
na área dos servomecanismos. Muitas vezes, as características de um determinado servomecanismo são descritas 
dando sua função transferência. Então, o teorema da convolução resulta no sinal de saída para um determinado 
sinal de entrada. 


20 A amplitude (ao quadrado) tem o típico denominador de ressonância, o formato da linha de Lorentz, Exercício 15.3.9. 
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Exercícios 
15.11.1 Pelo teorema da convolução, mostre que 


L Hs) = cl f ro) da), 
em que f(s) = L{F(t)}. 


15.11.2 Se F(t) = t° e G(t) = t°, a > —1, b > —1: 
(a) Mostre que a convolução 
1 
F*xG= pes yu (1 SA y)? dy. 
0 


(b) Usando o teorema da convolução, mostre que 


1 1b! 
a due, 
f U= y)" dy (a+b+ 1)! 


Essa é a fórmula de Euler para a função beta (Equação (8.59a)). 


15.11.3 Usando a integral de convolução, calcule 


ef CETO CETA + didi 


15.11.4 Um oscilador não-atenuado é propelido por uma força Fosen wt. Ache o deslocamento como uma 
função do tempo. Observe que ele é uma combinação linear de dois movimentos harmônicos 
simples, um com a fregiiência da força propulsora e um com a frequência wo do oscilador livre. 


(Admita X(0) = X'(0) = 0.) 


F 
Resposta: X (t) = Exa (sen wot — sen ot) ; 


w? — wê (wo 


Outros exercícios envolvendo a convolução de Laplace aparecem na Seção 16.2. 


15.12 Transformada Inversa de Laplace 
Integral de Bromwich 


Agora desenvolvemos uma expressão para a transformada inversa de Laplace £7! que aparece na equação 
F(t) = LH f(s)}. (15.205) 


Uma abordagem está na transformada de Fourier, da qual conhecemos a relação inversa. Porém, há uma 
dificuldade. Nossa função de Fourier transformável tinha de satisfazer as condições de Dirichlet. Em particular, 
exigíamos que 

lim G(w)=0, (15.206) 


de modo que a integral infinita seria bem definida.?! Agora desejamos tratar funções F(t) que podem divergir 
exponencialmente. Para vencer essa dificuldade, extraímos um fator exponencial, e%*, de nossa função de Laplace 
(possivelmente) divergente e escrevemos 

F(t) = e*G(t). (15.207) 


Se F(t) divergir quando e°*, exigimos que y seja maior do que a, de modo que G (t) será convergente. Agora, 
com G(t) = 0, para t < 0, e, quanto ao mais, convenientemente restrita, de modo que possa ser representada por 
uma integral de Fourier (Equação (15.20)), 


1 >, G 
G(t) = — / e“! du I G(v)je™? dv. (15.208) 
0 


“2 Dis 


21 Se estiverem incluídas funções G(w), pode ser um co-seno. Embora isso não satisfaça a Equação (15.206), G(w) ainda é limitada. 
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Usando a Equação (15.207), podemos reescrever (15.208) como 


E a ae 
F(t) = É— / e“! du / F(v)e Ve" do. (15.209) 
27 — 00 0 
Agora, com a mudança de variável, 

s= y+ iu, (15.210) 

a integral sobre v é lançada na forma de uma transformada de Laplace, 
/ F(v)e dv = f(s); (15.211) 

0 


agora, s é uma variável complexa, e R(s) > y, para garantir convergência. Note que a transformada de Laplace 
mapeou uma função especificada no eixo positivo real para o plano complexo, R(s) > 7.2 


s- plano 


x9 


Singularidades possíveis 


e” Ks) 


Figura 15.16: Singularidades de es" f (s). 


Sendo y constante, ds = i du. Substituindo a Equação (15.211) na Equação (15.209), obtemos 


1 y-Hioo ai 

F(t) = e NR e f(s) ds. (15.212) 
Aqui está nossa transformada inversa. Giramos a linha de integração em 90° (usando ds = idu). O caminho 
tornou-se uma reta vertical infinita no plano complexo, sendo que a constante ~y foi escolhida de modo que todas 
as singularidades de f(s) estão no lado esquerdo (Figura 15.16). 

A Equação (15.212), nossa transformação inversa, é usualmente conhecida como integral de Bromwich, 
embora às vezes também seja denominada teorema de Fourier-Mellin ou integral de Fourier-Mellin. Agora, 
essa integral pode ser avaliada pelos métodos regulares de integração de contorno (Capítulo 7). Set > 0,0 
contorno pode ser fechado por um semicírculo infinito no semiplano esquerdo. Então, pelo teorema do resíduo 
(Seção 7.1), 

F(t) = X (resíduos incluídos para R(s) < y). (15.213) 


É possível que esse meio de avaliação com R(s) se estendendo até valores negativos pareça paradoxal em vista 
de nossa exigência anterior de que R(s) > y. O paradoxo desaparece quando nos lembramos de que o requisito 
R(s) > y foi imposto para garantir a convergência da transformada integral de Laplace que definiu f(s). Uma 
vez obtida f(s), podemos continuar a explorar suas propriedades como uma função analítica no plano complexo 
qualquer que seja a escolha.” Na verdade, estamos empregando continuação analítica para obter LLF(t)) no 
semiplano esquerdo, exatamente como a relação de recorrência para a função fatorial foi usada para estender a 
definição de integral de Euler (Equação (8.5)) ao semiplano esquerdo. 
Talvez um par de exemplos possa esclarecer a avaliação da Equação (15.212). 


22Para uma derivação da transformada inversa de Laplace usando somente variáveis reais, veja C. L. Bohn e R. W. Flynn, Real variable 
inversion of Laplace transforms: An application in plasma physics. Am. J. Phys. 46: 1.250 (1978). 

23Em trabalho numérico é perfeitamente possível que f(s) esteja disponível somente para valores positivos de s reais e discretos. Então são 
indicados procedimentos numéricos. Veja Krylov e Skoblya nas Leituras Adicionais. 
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Exemplo 15.12.1 Inversão via CÁLcuLo DE Resípuos 


Se f(s) = a/(s? — a2), então 
aest aest 
EEr Trono (15.214) 


et f(s) 


Os resíduos podem ser achados usando o Exercício 6.6.1 ou vários outros meios. A primeira etapa é identificar as 


singularidades, os pólos. Aqui temos um pólo simples em s = a e outro pólo simples em s = —a. Pelo Exercício 
6.6.1, o resíduo em s = a é (5)e“ e o resíduo em s = —a é (— 5)e”“t. Então, 

Resíduos = (5) (e! — e7™%) = senh at = F(t), (15.215) 
de acordo com a Equação (15.105). E 
Exemplo 15.12.2 
Se 

1l- ets 
f) = =, 

então es(!—“) cresce exponencialmente para t < a no semi-círculo no plano s do lado esquerdo, de modo 


que a integração de contorno e o teorema do resíduo não são aplicáveis. Contudo, podemos avaliar a integral 
explicitamente como segue. Fazemos y — 0 e substituímos s = ty, portanto 


RO di dE a dy 
F(t) = — st f(s) = — iut etul) E., 15.216 
Usando a identidade de Euler, só os senos que são ímpares em y sobrevivem, e obtemos 
E t p= 
F(t) = h Es Kaiia 2w] (15.217) 
TJ-olL Y y 


Figura 15.17: Função degrau de comprimento finito u(t) — u(t — a). 


Se k > 0, então [7º Ser EY dy, e ela resulta em 7/2, e —7/2 se k < 0. Como conseqüência, F(t) = 0, se 
t>a>0,eset < 0.Se0 < t< a, então F(t) = 1, o que pode ser escrito de forma compacta em termos da 
função degrau unitária de Heaviside u(t), como segue: 


0, t <0, 
Ft)=ult)-ult-a)=4 1, 0<t<a, (15.218) 
0, t >a, 
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uma função degrau de altura unitária e comprimento a (Figura 15.17). E 


Convém fazer dois comentários. Primeiro, esses dois exemplos mal começam a mostrar a utilidade e o poder da 
integral de Bromwich. Ela está sempre disponível para inverter uma transformada complicada quando as tabelas 
se mostram inadequadas. 

Segundo, essa derivação não é apresentada como rigorosa. Ao contrário, ela é fornecida mais como um 
argumento de plausibilidade, embora possa ser transformada em rigorosa. A determinação da transformada inversa 
é um pouco parecida com a solução de uma equação diferencial. O modo como conseguimos a solução faz 
pouca diferença. Pode até ser apenas um palpite. A solução sempre pode ser verificada por substituição de 
volta na Equação diferencial original. De modo semelhante, F(t) pode ser verificada (e deve, para conferir erros 
descuidados), determinando se, pela Equação (15.99), 


L{F(t)} = F(s). 


Duas derivações alternativas da integral de Bromwich são os tópicos dos Exercícios 15.12.1 e 15.12.2. 
Como ilustração final da utilização da transformada inversa de Laplace, temos alguns resultados do trabalho de 
Brillouin e Sommerfeld (1914) em teoria eletromagnética. 


Exemplo 15.12.3 VELOCIDADE DE ONDAS ELETROMAGNÉTICAS EM UM MEIO DISPERSIVO 
A velocidade de grupo u de ondas progressivas está relacionada com a velocidade de fase v pela equação 


dv 
u=U AX (15.219) 
Aqui, À é o comprimento de onda. Na vizinhança de uma linha de absorção (ressonância), dv/d) pode 
ser suficientemente negativa, de modo que u > c (Figura 15.18). Imediatamente surge uma pergunta: um sinal 
pode ser transmitido mais rapidamente do que c, a velocidade da luz no vácuo? Essa pergunta, que admite que tal 
velocidade de grupo é significativa, é de fundamental importância para a Teoria da Relatividade Especial. 
Precisamos de uma solução para a equação de onda 


Py 18y 


maoe (15.220) 


correspondente a uma vibração harmônica começando na origem no tempo zero. Uma vez que nosso meio é 
dispersivo, v é uma função da freqüência angular. Imagine, por exemplo, uma onda plana, freqüência angular 
omega, w, incidindo sobre um obturador na origem. Para t = 0, o obturador é aberto (instantaneamente) e a onda 
pode avançar ao longo do eixo x positivo. 


Região anômala 


FA / 


vo) dv negativo 
dk 


dênci -0 q 
«— Componente de onda crescente, À Freqüência crescente, v = 2 


Figura 15.18: Dispersão óptica. 


Então, vamos desenvolver uma solução começando em x = 0. E conveniente usar a fórmula integral de Cauchy, 


Equação ((6.43), 
1 ET ani 
(0, t) = — dz = e™*™ 


271 2— 20 


(para um contorno circundando z = z9 no sentido positivo). Usando s = —iz e z9 = w, obtemos 
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t<0 t>0 


Figura 15.19: Contornos fechados possíveis. 


O o 0, tal, 
W(O,t) = Jri Joa FE ui = f eriat, >O. (15.221) 
Para ser completa, a integral do circuito é ao longo da reta vertical R(s) = y e e um semicírculo infinito, como 
mostra a Figura 15.19. A localização do semicírculo infinito é escolhida de modo que a integral sobre ele se anula, 
o que significa um semicírculo no semiplano esquerdo para t > O o resíduo é circundado. Para t < 0, pegamos o 
semiplano direito e nenhuma singularidade é circundada. O fato de que isso é exatamente a integral de Bromwich 
pode ser verificado observando que 


0, t<0, 
F(t) = i enit, t>0 (15.222) 
e aplicando a transformada de Laplace. A função transformada f(s) se torna 
1 
= ; 15.223 
19) = (15.223) 


Nossa integral de Cauchy-Bromwich nos fornece a dependência de tempo de um sinal que sai da origem em 
t = 0. Para incluir a dependência de espaço, notamos que 


es(t—2/v) 


satisfaz a equação de onda. Tendo isso como pista, substituímos t por t — x /v e escrevemos a solução: 


1 y+ioo est 2/0) 
ylz, t) j ES (15.224) 
Y 


© 2mi Jaio s+iw 

Na derivação da integral de Bromwich vimos que nossa variável s substitui a variável w da transformação de 
Fourier. Por conseguinte, a velocidade de onda v pode se tornar uma função de s, isto é, v(s). Aqui não precisamos 
nos preocupar com sua forma particular. Precisamos apenas da propriedade v < ce 

lim v(s) = constante, c. (15.225) 
|s|— œ 

Isso é sugerido pelo comportamento assintótico da curva no lado direito da Figura 15.18.24 

Avaliando a Equação (15.225) pelo cálculo de resíduos, podemos fechar o caminho de integração por um 
semicírculo no semiplano direito, contanto que 


rs e: 
E 
Daí, 
x 
plz, t)=0, t-+<0, (15.226) 


o que significa que a velocidade de nosso sinal não pode ultrapassar a velocidade da luz no vácuo, c. Esse resultado 
simples, porém significativo, foi estendido por Sommerfeld e Brillouin para mostrar exatamente como a onda 
avançava no meio dispersivo. E 


24 A Equação (15.225) resulta rigorosamente da teoria da dispersão anômala. Veja também as relações de dispersão óptica de Kronig-Kramers 
da Seção 7.2. 
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Resumo — Inversão de Transformada de Laplace 
e Uso direto de tabelas, Tabela 15.2 e referências; uso de frações parciais (Seção 15.8) e dos teoremas operacionais 


da Tabela 15.1. 


e Integral de Bromwich, Equação (15.212), e o cálculo de resíduos. 


e Inversão numérica, veja as Leituras Adicionais. 


Tabela 15.1 Operações com transformadas de Laplace 


Operações Equação 
1. Transformada de Laplace f(s) = L{F(t)} = / ecstr(t) dt (15.99) 
0 
2. Transformada de derivada sf(s) — F(+0) = L{F'(t)} (15.123) 
s? f(s) - sF(+0) — F(+40) = L{F”"(} (15.124) 


3. Transformada de integral 


4. Substituição 
5. Translação 
6 


. Derivada de transformada 


7. Integral de transformada 
8. Convolução 


9. Transformada inversa, integral de Bromwich 


LAs) = elf rt) dz) 


f(s — a) = Le“ F (t)} 


e=” f(s) = L{F(t — b)} 
FO (8) = LUH" FEY 


(Exercício 15.11.1) 


(15.152) 
(15.164) 
(15.173) 


(15.189) 


(15.193) 


(15.212) 
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Tabela 15.2 Transformadas de Laplace 


F(s) F(t) Limitação Equação 
1.1 e(t) Singularidade em +0 (15.141) 
1 
NE 1 s>0 (15.102) 
s 
l 
3; = {i s>0 (15.108) 
n>-—l 
1 
4. a et s>k (15.103) 
1 
5.— te*t k 15.175 
CEE e s> ( ) 
s 
k 
s 
8. ZL cos kt s>0 (15.107) 
k 
9. ENS] sen kt s>0 (15.107) 
s—a 
10. (s-a)? +k? e% cos kt sSs>a (15.153) 
k 
11. lsa) 4k? etsen kt s>a (15.153) 
2. k2 
12. EEE tcos kt s>0 (Exercício 15.10.19) 
2k 
13. TF tsen kt s>0 (Exercício 15.10.19) 
14, (52 + a?) 1/2 Jo(at) s>0 (15.185) 
15. (s? — 02)-1/2 To(at) s>a (Exercício 15.10.9) 
1 
16. =cotg (=) jo(at) s>0 (Exercício 15.10.10) 
1 s+a 
TA E io(at) s>a (Exercício 15.10.10) 
=cotgh* ) 
a 
(s - a)” E 
18. Rn Lalat) s>0 (Exercício 15.10.12) 
1 
19. =In(s + 1) Ei(x) = —Ei(-a) s>0 (Exercício 15.10.13) 
s 
l 
Deas -Int-y s>0 (Exercício 15.12.9) 


S 


Uma tabela de transformadas de Laplace mais extensiva aparece no Capítulo 29 de AMS-55 (referência dada na nota de rodapé 4 no 


Capítulo 5). 


Exercícios 
15.12.1 Derive a integral de Bromwich pela fórmula integral de Cauchy. 
Sugestão: Aplique a transformada inversa L7} a 


1 y+ia 
f(s) = — lim J LORT 
2Ti a> Jy ia SZ 


em que f(z) é analítica para R(z) > y. 


760 
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15.12.2 


15.12.3 
15.12.4 


15.12.5 


15.12.6 


15.12.7 


15.12.8 


Começando com 


mostre que, introduzindo 
F= f espa, 
0 


podemos converter uma integral na representação de Fourier de uma função delta de Dirac. A partir 
disso, derive a transformada inversa de Laplace. 


Derive o teorema da convolução da transformação de Laplace usando a integral de Bromwich. 


Ache 
q s 
mize) 


(a) por uma expansão por frações parciais. 
(b) Repita, usando a integral de Bromwich. 


Ache 7 
Lo es 
s(s2 + k?) 


(a) usando uma expansão por frações parciais. 
(b) Repita, usando o teorema da convolução. 
(c) Repita, usando a integral de Bromwich. 


Resposta: F(t) = 1 — cos kt. 
Use a integral de Bromwich para achar a função cuja transformada é f(s) = s712. Note que f(s) 
tem um ponto de ramificação em s = 0. O eixo x negativo pode ser considerado uma linha de corte. 


Resposta: F(t) = (nt) 1/2. 
Mostre que 
MS An E = ole) 


por avaliação da integral de Bromwich. 
Sugestão: Converta sua integral de Bromwich em uma representação integral de Jo(t). A 
Figura 15.20 mostra um possível contorno. 


Figura 15.20: Um possível contorno para a inversão de Jo(t). 


Avalie a transformada inversa de Laplace 
LHH (8? = Ra 


por cada um dos métodos seguintes: 
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(a) Expansão em uma série e inversão termo a termo. 
(b) Cálculo direto da integral de Bromwich. 
(c) Mudança de variável na integral de Bromwich: s = (a/2)(z + 21). 


15.12.9 Mostre que 
l 
co (Eb mes, 
s 


em que y = 0, 5772... é a constante de Euler-Mascheroni. 
15.12.10 Avalie a integral de Bromwich para 
s 


15.12.11 Teorema da expansão de Heaviside. Se a transformada f(s) puder ser escrita como uma razão 


f(s) = 


em que g(s) e h(s) são funções analíticas, sendo que h(s) tem zeros simples, isolados em s = s;, 


mostre que 
F(t) = gal e Es 2 E est, 


h(s 
Sugestão: Veja o Exercício 6.6.2. 
15.12.12 Usando a integral de Bromwich, inverta f(s) = s2e-*s. Expresse F(t) = L7H f(s)} em termos 
da função degrau unitária (deslocada) u(t — k). 
Resposta: F(t) = (t — kJu(t — k). 
15.12.13 Você tem uma transformada de Laplace: 


1 


f(s) = EE 


a + b. 


Inverta essa transformada por cada um dos três métodos: 


(a) Frações parciais e uso de tabelas. 
(b) Teorema da convolução. 
(c) Integral de Bromwich. 


—bt 


e — € 
b. 
a—b po 


at 


Resposta: F(t) = 
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mencionadas neste capítulo, bem como em vários outros. São incluídas muitas aplicações. 

Van der Pol, B., e H. Bremmer, Operational Calculus Based on the Two-sided Laplace Integral, 3% ed., 
Cambridge, UK: Cambridge University Press (1987). Temos aqui um desenvolvimento baseado no intervalo 
—oo a +00, em vez da útil O a oo. O Capítulo V contém um estudo detalhado da função delta de Dirac (função 
impulso). 

Wolf, K. B., Integral Transforms in Science and Engineering. Nova York: Plenum Press (1979). Esse livro é um 
tratamento muito abrangente de transformadas integrais e suas aplicações. 
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Equações Integrais 


16.1 Introdução 


Com a exceção das transformadas integrais do capítulo anterior, até aqui consideramos relações 

entre a função desconhecida y(x) e uma ou mais de suas derivadas. Agora, vamos investigar 

funções que contêm a função desconhecida dentro de uma integral. Como no caso das equações diferenciais, 

limitaremos nossas atenções a relações lineares, equações integrais lineares. Equações integrais são classificadas 

de duas maneiras: 

e Se os limites de integração forem fixos, denominamos a equação de equação de Fredholm; se um limite for 
variável, é uma equação de Volterra. 

e Se a função desconhecida aparecer somente sob o sinal de integral, nós a denominamos de primeira espécie. 
Se ela aparecer dentro e fora do sinal de integral, é denominada de segunda espécie. 


Definições 
Em representação simbólica, temos uma equação de Fredholm de primeira espécie, 


b 
fa) = i K(z,t)p(t) dt; (16.1) 


a equação de Fredholm de segunda espécie, sendo À o autovalor, 


b 
lx) = f(x) + Ef K(x, t)p(t) dt; (16.2) 


a equação de Volterra de primeira espécie, 


Fe) = | Kæ Dol) de (16.3) 
e a equação de Volterra de segunda espécie, 


olx) = f(x) + o K(x,t)p(t) dt. (16.4) 


Em todos os quatro casos y(t) é a função desconhecida. Admitimos que K (x, t), que denominamos núcleo, e 
f(x) são desconhecidos. Quando f(x) = 0, a equação é denominada homogênea. 

Por que nos incomodarmos com equações integrais? Afinal, até agora as equações diferenciais fizeram um 
trabalho muito bom na descrição de nosso mundo físico. Há diversas razões para introduzir equações integrais 
agui. 

Demos considerável ênfase à solução de equações diferenciais sujeitas a condições de contorno particulares. 
Por exemplo, a condição de contorno para r = 0 determina se a função de Neumann Na(r)O está presente 
quando é resolvida uma equação de Bessel. A condição de contorno para Na(r) está presente 
quando é resolvida uma equação de Bessel. A condição de contorno para r — oo determina se T, (1) está presente 
em nossa solução da equação modificada de Bessel. A equação integral relaciona a função desconhecida, não 
somente com seus valores em pontos vizinhos (derivadas), mas também com seus valores em toda uma região, 
incluindo o contorno. De modo muito real, as condições de contorno são embutidas na equação integral, em vez 
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de impostas no estágio final da solução. Podemos ver na Seção 10.5, em que núcleos são construídos, que a forma 
do núcleo depende dos valores no contorno. Então, a equação integral é compacta e pode se revelar uma forma 
mais conveniente ou poderosa do que a equação diferencial. Problemas matemáticos como existência, unicidade 
e completude muitas vezes podem ser manipulados com mais facilidade e elegância em forma integral. Por fim, 
gostemos ou não, há alguns problemas, tais como alguns fenômenos de difusão e transporte, que não podem 
ser representados por equações diferenciais. Se quisermos resolver tais problemas, somos forçados a operar com 
equações integrais. Por fim, uma equação integral também pode aparecer como uma questão de escolha deliberada 
baseada na conveniência ou na necessidade do poder matemático de uma formulação de equação integral. 


Exemplo 16.1.1 REPRESENTAÇÃO DE MOMENTUM EM MECÂNICA QUÂNTICA 
A equação de Schrödinger (em representação de espaço ordinário) é 


h2 
-z V VE) +Ver) = Eyr), (16.5) 
ou 
(V? + a?) y(r) = v(r)p(r), (16.6) 
em que 
a = mp, v(r) = E V(. (16.7) 
Se generalizarmos a Equação (16.6) para 
(V? + a) w(r) = fot rpl) dr, (16.8) 
então, para o caso especial de 
vlr, r) = v(r)ó(r — r’), (16.9) 


uma interação local, a Equação (16.8) se reduz à Equação (16.6). Considere o par de transformadas de Fourier 1) e 
Y (compare com a nota de rodapé 9 na Seção 15.6): 


= 1 —ikr 43 = 1 ikr 73 
com a abreviação p para o momentum, de modo que 
A =k (número da onda). (16.11) 


Multiplicando a Equação (16.8) pelo e—'k”, de onda plana, obtemos 
DE ta + a) y(r) dr = fë gr Er / v(r,r)y(r”) dr. (16.12) 


Note que o V 2 da esquerda opera somente sobre a y(r). Integrando o lado esquerdo por partes e substituindo a 
Equação (16.10) por y(r’) no lado direito, obtemos 


| (— K? + a) y(r)e ™ dr = (27)? ( — k? 4 a?) (ke) 
E o SIS v(r, r) P(k ei Erk r") dr drak. (16.13) 
RE 


Se usarmos 


1 f Pg 
Jk) = yA Ma o (16.14) 


a Equação (16.13) se torna 
(- k? +a°)Y(k) = fe eme w, (16.15) 


a equação de Fredholm de segunda espécie na qual o parâmetro a? corresponde ao autovalor. 
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Para nosso caso especial, porém importante, de interação local, a aplicação da Equação (16.9) leva a 
f(k,k’) = f(k- k’). (16.16) 
Essa é nossa representação de momentum, equivalente a um potencial ordinário de interação estática no espaço 
de coordenadas. Nossa função de onda de momentum Y (k) satisfaz a equação integral, Equação (16.15). Devemos 
enfatizar que, até aqui, admitimos que as integrais de Fourier requeridas existem. Para um potencial de oscilador 
harmônico, V(r) = r°, as integrais requeridas não existiriam. A Equação (16.10) levaria a oscilações divergentes 
e não teríamos nenhuma Equação (16.15). E 


Transformação de uma Equação Diferencial em uma Equação Integral 

Muitas vezes descobrimos que temos uma opção. O problema físico pode ser representado por uma equação 
diferencial ou por uma equação integral. Vamos admitir que temos a equação diferencial e desejamos transformá-la 
em uma equação integral. Começando com uma EDO linear de segunda ordem 


y” + A(x)y' + B(x)y = g(x) (16.17) 


com condições iniciais 


integramos para obter 


x 


y (a) = — E A(t)y' (t) dt — J B(t)y(t) dt + f g(t) dt + yo- (16.18) 


Integrando a primeira integral da direita por partes, temos como resultado 


x 


va) = Auto) — | (B-AJ) dt f g0) dt + AaJgo + 1h (16.19) 


Note como as condições iniciais estão sendo absorvidas em nossa nova versão. Integrando uma segunda vez, 
obtemos 


y(x) = — f Ay dz — T du n [B(t) — A'(t) | y(t) dt 


+ / du f g(t) dt + [A(a)yo + yo] (£ — a) + yo. (16.20) 


Para transformar essa equação em uma forma mais caprichada, usamos a relação 


J du f f(t) dt = [e-oro dt. (16.21) 


Essa expressão pode ser verificada diferenciando ambos os lados. Visto que as derivadas são iguais, as expressões 
originais só podem diferir por uma constante. Fazendo x — a, a constante desaparece e a Equação (16.21) é 
estabelecida. Aplicando-a à Equação (16.20), obtemos 


x 


ylz) =- | {AŒ + (x — DIB) — AH] yyt) dt 


+ J (x — t)g(t)dt + [A(a)yo + Yol (x— a) + yo. (16.22) 
Se agora introduzirmos as abreviações 
K(x,t) = (t— =) [B(t) — A(O] — A(t), 


x (16.23) 
fa) = f (e — t)g(t) de + [A(a)yo + yb] (2 — a) + 3; 


a Equação (16.22) se torna 
o) = Ho) + | Kledd, (1624) 


que é a equação de Volterra de segunda espécie. Essa reformulação como equação integral de Volterra oferece 
certas vantagens em questões de investigação de existência e unicidade. 
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Exemplo 16.1.2 EQUAÇÃO DO OSCILADOR LINEAR 
Como ilustração, considere a equação de oscilador linear 


y" +w y=0 (16.25) 
com 
y(0)=0,  y'(0)=1. 
Isso resulta em (compare com a Equação (16.17)) 
A(x) =0, B(x) = w?, g(x) = 0. 
Substituindo na Equação (16.22) (ou Equações (16.23) e (16.24)), constatamos que a equação integral se torna 


ylz) =z+w? [e — x)y(t) dt. (16.26) 


e Essa equação integral, Equação (16.26), é equivalente à equação diferencial original mais as condições iniciais. 
Uma verificação mostra que cada forma é, de fato, satisfeita por y(x) = (1/w)sen wz. 


Vamos reconsiderar a equação de oscilador linear (16.25), mas agora com as condições de contorno 


y(0) = 0, y(b) = 0. 


Uma vez que y’ (0) não é dada, devemos modificar o procedimento. A primeira integração resulta em 


y = -u f y da + y' (0). (16.27) 
0 


Integrando uma segunda vez e usando novamente a Equação (16.21), temos 
y= -u f (x — t)y(t) dt + y'(0)x. (16.28) 
0 


Para eliminar y'(0), desconhecida, agora impomos a condição y(b) = 0, que resulta em 


b 
w? f (b — t)y(t) dt = by' (0). (16.29) 
0 
Substituindo essa expressão de volta na Equação (16.28), obtemos 
£ b 
y(x) = —w? pi (x — t)y(t) dt + w / (b — t)y(t) dt. (16.30) 
0 0 
Agora vamos dividir o intervalo [0, b] em dois intervalos [0, x] e [x:, b]. Uma vez que 
t 
S(b )-(2-)=;(b-a), (16.31) 
achamos ' 
Et 
y(x) = o? f zÊ — x)y(t)dt + a f AU — t)y(t) dt. (16.32) 
0 £ 
Por fim, se definirmos um núcleo (Figura 16.1) 
t 
-(b— x), t<a, 
K(z,t)=< È, (16.33) 
zÉ ra t), t> T, 
temos i 
y(x) = w? / K(x, t)y(t) dt, (16.34) 
0 


uma equação de Fredholm homogênea de segunda espécie. 
Nosso novo núcleo, K (x, t), tem algumas propriedades interessantes. 
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N =e 


K(x, À 


Figura 16.1: 
. É simétrico, K (x,t) = K (t, x). 
. É contínuo, no sentido de que 
t £ 
-(b — =-(b—t à 
p, z) t=a p, ) t=x 


3. Sua derivada em relação a t é descontínua. À medida que t aumenta até o ponto t = x, há uma descontinuidade 
de —1 em K(x, t)/ðt. 

De acordo com essas propriedades, na Seção 9.7 identificamos K (x, t) como uma função de Green. 

1. Na transformação de uma EDO linear de segunda ordem em uma equação integral, as condições iniciais ou de 
contorno desempenham um papel decisivo. Se tivermos condições iniciais (somente uma extremidade de nosso 
intervalo), a equação diferencial se transforma em uma equação integral de Volterra. No caso da equação do 
oscilador linear com condições de contorno (ambas as extremidades de nosso intervalo), a equação diferencial 
leva a uma equação integral de Fredholm com um núcleo que será uma função de Green. 

2. Note que a transformação inversa (equação integral para equação diferencial) nem sempre é possível. Existem 
equações integrais para as quais nenhuma equação diferencial correspondente é conhecida. 


Exercícios 


16.1.1 


16.1.2 


16.1.3 


16.1.4 


Começando com a EDO, integre duas vezes e derive a equação integral de Volterra corres- 
pondente a 


(a) y(x) — y(x) = 0; y(0)=0, yi(0) =1. 
Resposta: y = f (x — t)y(t)dt + z. 
b) y”(x)—- y) =0; y(0)=1, y(0)=-1. 


Resposta: y = / (x — tylt) dt—- xz +1. 
0 


Verifique seus resultados com a Equação (16.23). 


Derive uma equação integral de Fredholm correspondente a 


y”(æ)—-y(z)=0, yl)=1, 0 y-l=a, 
(a) integrando duas vezes, 
(b) formando a função de Green 


1 
Resposta: y(x) = 1 -f K(x, t)y(t) dt, 
-1 


1 —a)(t+ 1, r>t, 
Kags 
la-t(z+1), e<t 
a omeçando com as respostas dadas no Xercicio «1.1, diferencie e recupere as S 
(a) Começand p dad Exercício 16.1.1, diferenci p EDO 


originais e as condições de contorno. 
(b) Repita para o Exercício 16.1.2. 


A EDO linear geral de segunda ordem com coeficientes constantes é 


y” (a) + ay (x) + azy(x) = 0. 
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Dadas as condições de contorno 
y(0) = y(1) =0, 
integre duas vezes e desenvolva a equação integral 


2) = f K(&, t)y(t) dt, 


com 
K(x,t) = azt(1 — x) + a(x — 1), t<a, 
azx(1 — t) + aiz, q <t. 


Note que K (x, t) é simétrico e contínuo se ay = 0. Como isso se relaciona à condição de subadjunta 
da EDO? 


16.1.5 Verifique que [O f7 f(t)dtdz = [í(a — t)f(t) dt para todo f(t) (para as quais as integrais 
existem). 


16.1.6 Dada y(x) = q — do. (t — x)p(t) dt, resolva essa equação integral convertendo-a em uma EDO 
(mais condições de contorno) e resolvendo a EDO (por inspeção). 


16.1.7 | Mostre que a equação de Volterra homogênea de segunda espécie 


p(x) = af K(x, tt) dt 


não tem nenhuma solução (à parte a trivial Yy = 0). 
Sugestão: Desenvolva uma expansão de Maclaurin de y(x). Admita que y(x) e K(x,t) são 
diferenciáveis em relação a x como necessário. 


16.2 Transformadas Integrais, Funções Geradoras 


Assim como a diferenciação, EDOs lineares são resolvidas no Capítulo 9. Assim como a integração, não há nenhum 
método geral disponível para resolver equações integrais. Contudo, certos casos especiais podem ser tratados com 
nossas transformadas integrais (Capítulo 15). Por conveniência, apresentamos aqui uma lista. Se 


1 ES txt 
vo) = = n Ed, 


então, 
nã, 11 se —ixt : 
lx) = zje p(t) dt (Fourier). (16.35) 
Se As 
ve= | otat 
então, 
1 y+ioo 
o(a) = = eTtp(t) dt (Laplace). (16.36) 
27% Lico 
Se Ja 
vla= | toa, 
0 
então, 
Et pn z d Melli 16.37 
D= a tab(t) dt (Mellin). (16.37) 
Se da 
vt = | tO), 
0 
então, 


p(z) = / z ty(t)J (xt)dt (Hankel). (16.38) 
0 


Na verdade, a utilidade da técnica da transformada integral vai um pouco além dessas quatro formas 
especializadas. 
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Exemplo 16.2.1 SOLUÇÃO DE TRANSFORMADA DE FOURIER 
Vamos considerar uma equação de Fredholm de primeira espécie com um núcleo do tipo geral k(x — t), 


fla) = T k(x — t)olt) dt, (16.39) 


—00 


no qual y(t) é nossa função desconhecida. Admitindo que a transformada necessária exista, aplicamos o 
teorema da convolução de Fourier (Seção 15.5) para obter 


f(x) = i K(w)d (w) dw. (16.40) 


As funções K(w), P(w) e F(w) são as transformadas de Fourier de k(x), p(x) e f(x), respectivamente. 
Considerando a transformada de Fourier de ambos os lados da Equação (16.40), pela Equação (16.35) temos 


1. ia 5 F(w) 
K(w)d = — “o da — : 16.41 
= = Ho de= E (1641) 
Então, 
1 F(w) 
blw) = -= IR (16.42) 
v2 (w) 
e, usando a transformada inversa de Fourier, temos 
1 [O F(w) 
= — 2 Ne ar IUR duj. 16.4 
pla) e a Ke dw (16.43) 


Para uma justificativa rigorosa desse resultado, podemos seguir Morse e Feshbach (veja as Leituras Adicionais) 
(1953) em campos complexos. Uma extensão dessa solução de transformação aparece como o Exercício 16.2.1. 


Exemplo 16.2.2 EQUAÇÃO GENERALIZADA DE ABEL, TEOREMA DA CONVOLUÇÃO 
A equação generalizada de Abel é 


o= [Sc pegel com | 


f(x) conhecida, 


p(t) desconhecida. Lan 


Considerando a transformada de Laplace de ambos os lados dessa equação, obtemos 
= ” glt) Apia 
L{ fl} =L e = ele Lia! (16.45) 
f RE 
a última etapa segundo o teorema da convolução de Laplace (Seção 15.11). Então, 
ste L4 f(x 
L{p(2)} = Ea 2a (16.46) 


Dividindo por s,! obtemos 


Le{ela)} z eul E “o Pira (16.47) 


Combinando os fatoriais (Equação (8.32)) e aplicando mais uma vez o teorema da convolução de Laplace, 


constatamos que 
t t{ola)} mi zef f ima, (16.48) 
0 


T x —t)l-e 


Invertendo com a ajuda do Exercício 15.11.1, obtemos 


A 20 dt = sen TQ E > ii dt, (16.49) 
0 0 


T 


e por fim, por diferenciação, 


p(z) = 7 dt. (16.50) 


Igl-a não tem uma inversa para 0 < a < 1. 
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Funções Geratrizes 
Ocasionalmente, o leitor pode encontrar equações integrais que envolvem funções geratrizes. Suponha que temos 
o caso admitidamente especial 


1 
i 
kasf. TE mt feed: (16.51) 


Notamos duas características importantes: 
1. (1 — 2zt + 42)-!/2 gera os polinômios de Legendre. 
2. [-1,1] é o intervalo de ortogonalidade para os polinômios de Legendre. 


Se agora expandirmos o denominador (propriedade 1) e admitirmos que nossa função desconhecida y(t) pode 
ser escrita como uma série desses mesmos polinômios de Legendre, 


1 O oo 
f(x) = PD aro eia dt. (16.52) 


Utilizando a ortogonalidade dos polinômios de Legendre (propriedade 2), obtemos 


9a 
jni Ti 1 . 
f(x) 2 E 17 (16.53) 
Podemos identificar a,, diferenciando n vezes e então fazendo x = O: 
2 
()(0) =! ; 16.54 
OR E (16.54) 
Daí, 
X 2n +1 f™(0) 
H= Palt). 16.55 
o=) 5a O (16.55) 


Resultados similares podem ser obtidos com as outras funções geratrizes (compare com o Exercício 7.1.6). 
e Essa técnica de expandir em uma série de funções especiais está sempre disponível. Vale uma tentativa sempre 
que a expansão for possível (e conveniente) e o intervalo for adequado. 


Exercícios 
16.2.1 | O núcleo de uma equação de Fredholm da segunda espécie, 


elo) = fata f “(o t)p(t) dt, 


é da forma k(x — t).? Admitindo que as transformadas requeridas existem, mostre que 


a 1 © Feijo tdi 
dis v27 5 1- VAK (t) 


F(t) e K(t) são as transformadas de Fourier de f(x) e k(x), respectivamente. 


16.2.2 O núcleo de uma equação de Volterra de primeira espécie, 


me] “Elo, t)p(t) dt, 


tem a forma k(x — t). Admitindo que as transformadas requeridas existem, mostre que 


cd RE 
o(a) = À OM ds. 


—ioo 


F(s) e K(s) são as transformadas de Laplace de f(x) e k(x), respectivamente. 


2Esse núcleo e um intervalo 0 < x < oo são características de equações integrais do tipo Wiener-Hopf. Detalhes serão encontrados no 
Capítulo 8 de Morse e Feshbach (1953): veja as Leituras Adicionais. 
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16.2.3 


16.2.4 


16.2.5 


16.2.6 


16.2.7 


16.2.8 


16.2.9 


O núcleo de uma equação de Volterra de segunda espécie, 


PORT f Keneit, 


tem a forma k(x — t). Admitindo que as transformadas requeridas existem, mostre que 
1 p> F(s) 
Esto aa ATO Grs d. f 
P= a a I-AK) 
Usando a solução de transformada de Laplace (Exercício 16.2.3), resolva 
(à) pa) =2+ | (t-aol dt 
0 


Resposta: y(x) = sen zx. 


© el =z- [ E-a dt, 


Resposta: y(x) = senh z. 
Verifique seus resultados substituindo de volta nas equações integrais originais. 


Reformule as equações do Exemplo 16.2.1 (Equações (16.39) a (16.43)) usando transformadas de 
Fourier de co-seno. 


Dada a equação integral de Fredholm, 
Ew = i, eT- y(t) dt, 


aplique a técnica de convolução de Fourier do Exemplo 16.2.1 para resolver para (t). 


Resolva a equação de Abel, 


ro f Sa 0<a<l, 


pelo seguinte método: 


(a) Multiplique ambos os lados por (z — x)! e integre com relação a x no intervalo O < x < z. 
(b) Inverta a ordem de integração e avalie a integral do lado direito (com relação a x) pela função 
beta. 


Nota: 


E dx E 
J (z= zx) = B(1 - a, a) = (-a)l(a — 1)! = 


t=a(g a o 
Dada a equação generalizada de Abel com f(x) = 1, 
t 
1= | Eur 0O<ac<l, 
o (x—t)e 
resolva para y(t) e verifique que y(t) é uma solução da equação dada. 


sen 
Resposta: y(t) = CM TO ami, 
T 


A equação de Fredholm de primeira espécie tem um núcleo e70’, 
H)= f E gl) dt, 


Mostre que a solução é 


1 <& f™(0 
= 530 g Mh 


na qual H, (x) é um polinômio de Hermite de enésima ordem. 
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16.2.10 Resolva a equação integral 


f(x) -f A RE ETE 


a (1 — 2st +r?) 0 


para a função desconhecida y(t) se 


(a) f(r) =, (b) f(x) = zt, 
Resposta: (a) y(t) = 


> Post), œ) y(t) = o Passat). 


16.2.11 Uma análise da teoria da difração de Kirchhoff de um laser leva à equação integral 
u(ro) = 9 JJ K(ry,ro)u(r) dA. 
A função desconhecida, v(r1), dá a distribuição geométrica do campo de radiação sobre uma 
superfície de espelho; a faixa de integração é sobre a superfície daquele espelho. Para espelhos 


esféricos confocais, a equação integral se torna 


x o (cada AR DAR 
v(xa,y2) = Xb e v(£1, y1) des dy, 


na qual b é a distância na linha central entre os dois espelhos laser. Isso pode ser colocado em forma 
um pouco mais simples pelas substituições 


kx 


kr? -g ky? ka? = 2ra? 9 
b E) 


= Ni e b Xb La a 


(a) Mostre que as variáveis se separam e obtemos duas equações integrais. 

(b) Mostre que os novos limites, +a, podem ser aproximados por +00 para uma dimensão de 
espelho a > À. 

(c) Resolva as equações integrais resultantes. 


16.3 Série de Neumann, Núcleos Separáveis (Degenerados) 


Muitas e provavelmente a maioria das equações integrais não podem ser resolvidas pelas técnicas especializadas de 
transformadas da seção anterior. Aqui desenvolvemos três técnicas bastante gerais para resolver equações integrais. 
A primeira, devida em grande parte a Neumann, Liouville e Volterra, desenvolve a função desconhecida y(x) como 
uma série de potências em À, em que À é uma constante dada. O método é aplicável sempre que a série convergir. 

O segundo método é um tanto restrito porque requer que as duas variáveis que aparecem no núcleo K (x,t) 
sejam separáveis. Contudo, há duas importantes recompensas: (1) a relação entre uma equação integral e um 
conjunto de equações algébricas lineares simultâneas é mostrada explicitamente, e (2) o método leva a autovalores 
e autofunções, em estreita analogia com a Seção 3.5. 

No terceiro método é delineada uma técnica, para a solução numérica de equações de Fredholm de primeira e 
de segunda espécies. O problema proposto pelas matrizes mal condicionadas é enfatizado. 


Série de Neumann 


Resolvemos uma equação integral linear da segunda espécie por aproximações sucessivas; nossa equação integral 
é a equação de Fredholm, 


b 
lx) = f(x) + af K(x,t)o(t)dt, (16.56) 


na qual f(x) # 0. Se o limite superior da integral for uma variável (equação de Volterra), o seguinte 
desenvolvimento ainda será válido, mas com pequenas modificações. Vamos tentar (não há nenhuma garantia 
de que funcionará) aproximar nossa função desconhecida por 


p(z) = pola) = f(x). (16.57) 
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Essa opção não é obrigatória. Se você tiver um palpite melhor, não se acanhe. Aqui, a opção equivale a dizer que 
a integral ou a constante À é pequena. Para melhorar essa primeira aproximação grosseira, recolocamos po(x) na 
integral, Equação (16.56), e obtemos 


b 
pia) = f(x) + f K(x, t) f(t) dt. (16.58) 


Repetindo o processo de substituir a nova p, (1) de volta na Equação (16.56), desenvolvemos a seqüência 


b 
enla) = Ha) + à I K(x, tu) f(ta) dt 


b pb 
+ IN) K(x,t1)K (t1, t2) f(to) dto dty (16.59) 
= n 
Pulo) =D Nu(a), (16.60) 
1=0 
em que 


b 
u(o)= f K(x, ti) f(tı)dtı, 


eb (16.61) 
uz(x) = [| K(x,t)K(trto)f(to) dto dtı, 
unla) = ff | Kle n)K(tnta) A EENE f(tn) dn eder. 
Esperamos que nossa solução y(x) seja 
pla) = im Pnl) = mY Auil£), (16.62) 
i=0 


contanto que nossa série infinita convirja. Podemos verificar convenientemente a convergência pelo teste da raiz 
de Cauchy, Seção 5.2, observando que 


[AP un(2)] < [AP] | flmáx Klimax: lè- al”, (16.63) 


M 
max 


usando |f|máx para representar o valor máximo de |f(x)| no intervalo [a,b] e |K|máx para representar o valor 
máximo de |K (x, t)| nesse domínio no plano x, t. Temos convergência se 


Al: 1H Jmáx lb- a] <1. (16.64) 


Note que Aļun (máx)| está sendo usado como uma série de comparação. Se ele convergir, nossa série propriamente 
dita deve convergir. Se essa condição não for satisfeita, podemos ter ou não ter convergência. É preciso um teste 
mais sensível. É claro que, mesmo que a série de Neumann divirja, ainda poderá haver uma solução capaz de ser 
obtida por outro método. 

Para ver o que foi feito com essa manipulação iterativa, talvez seja proveitoso reescrever a solução de série de 
Neumann, Equação (16.59), em forma de operador. Começamos reescrevendo a Equação (16.56) como 


p= AKp+ f, 
onde K representa o operador integral f? K(x, t)|] dt. Resolvendo para y, obtemos 
p=(1-AK)f. 


Expansão binomial leva à Equação (16.59). A convergência da série de Neumann é uma demonstração de que o 
operador inverso (1 — AK)™t existe. 
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Exemplo 16.3.1 SOLUÇÃO DE SÉRIE DE NEUMANN 
Para ilustrar o método de Neumann, consideramos a equação integral 


1 1 
o(a) = a + F (t — x)y(t) dt. (16.65) 
-1 
Para iniciar a série de Neumann, consideramos 
polz) = x. (16.66) 
Então, 
Tj? 1/13 1 F 
pila) = + z| t-atat=0+ sG- 5er) l =r+>= 
Substituindo y; (x) de volta na Equação (16.65), obtemos 
1 dá 1f 1 1 az 
= E t— a)tdt+ — t — x)-dt = Saey 
pala) =2+3 | -atat | oagdt= +55 
Continuando esse processo de substituição de volta na Equação (16.65), obtemos 
G p E 1 
rt) =t+5-5- Ss 
P3 3 3 3? 
e, por indução, 
Ponlz)=2+5 (-Dolss — r X (-ntiaos. (16.67) 
s=1 s=1 
Fazendo n — oco, obtemos 
3 1 
=- =. 16.68 
plx) q” + I ( ) 
Essa solução pode (e deve) ser verificada substituindo de volta na equação original, Equação (16.65). E 


É interessante notar que nossa série convergiu com facilidade, ainda que a Equação (16.64) não seja satisfeita 
nesse caso particular. Na verdade, a Equação (16.64) é um limite superior bastante grosseiro para A. Podemos 
mostrar que uma condição necessária e suficiente para a convergência de nossa solução de série é que |A| < [Ae], 
onde Ae é o autovalor de menor grandeza da equação homogênea correspondente [f(x:) = 0)]. Para esse exemplo 
particular, A. = 3/2. Claramente, A = 5 < àe = V3/2. 

Uma abordagem para o cálculo de perturbações dependentes de tempo em Mecânica Quântica começa com a 
equação integral para o operador de evolução 


>. pt 
Utto) =1-4 f V(t1)U (tı, to) dti. (16.69a) 


to 


iteração leva a 


y t :N2 t pti 
Utt) =1- i f vean (5) J A A ARETA (16.69b) 
to to! to 


O operador de evolução é obtido como uma série de múltiplas integrais do potencial perturbador V (t), em estreita 
analogia com a série de Neumann, Equação (16.60). Para V = Wo, independente de t, o operador de evolução 
se torna (veja o Exercício 3.4.13, substitua t — At e construa U a partir dos produtos de T(t + At, t) como na 
Equação (4.26)) 
i 
Ultasto) = exp|=lt = tovo. 
Uma segunda relação semelhante entre a série de Neumann e a Mecânica Quântica aparece quando a equação de 
onda de Schrödinger para dispersão é reformulada como uma equação integral. O primeiro termo em uma solução 
de série de Neumann é a onda incidente (não-perturbada). O segundo termo é a aproximação de primeira ordem 
de Born, Equação (9.203b) da Seção 9.7. 
O método de Neumann também pode ser aplicado às equações integrais de Volterra da segunda espécie, 
Equação (16.4) ou Equação (16.56) com o limite superior fixo, b, substituído por uma variável, x. No caso de 
Volterra, a série de Neumann converge para todo À, contanto que o núcleo seja de quadrado integrável. 
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Núcleo Separável 
A técnica de substituir nossa equação integral por equações algébricas simultâneas também pode ser usada sempre 
que nosso núcleo K (x, t) for separável, no sentido de que 


n 


K(x, t) = X` M;(£)N;(t), (16.70) 


j=1 


em que n, o limite superior da soma, é finito. Tais núcleos às vezes são denominados degenerados. Nossa classe 
de núcleos separáveis inclui todos os polinômios e muitas das funções transcendentais elementares, isto é, 


cos(t — x) = cos t cos x + sen z tsen x. (16.70a) 


Se a Equação (16.70) for satisfeita, a substituição na equação de Fredholm de segunda espécie, Equação (16.2), 
resulta em 


n b 
pa) = FEAS Mito) | NO de (1671) 
j=1 e 
permutando integração e somatório. Agora, a integral em relação a t é uma constante, 
b 
A N;(t) (lt) dt = cj. (16.72) 
Por conseguinte, a Equação (16.71) se torna 
p(x) = f(x) +AD Mila). (16.73) 
j=1 


Isso nos dá (x), nossa solução, uma vez que as constantes c; tenham sido determinadas. A Equação (16.73) ainda 
nos indica a forma de y(x): f(x), mais uma combinação linear dos fatores dependentes de x do núcleo separável. 

Podemos achar c; multiplicando a Equação (16.73) por N;(x) e integrando para eliminar a dependência de zx. 
A utilização da Equação (16.72) resulta em 


G=b+AD aos (16.74) 
j=1 
onde 
b b 
bi = [ Ni(a) f(x) de, Qij = f N;(x) M; (x) dz. (16.75) 
Talvez seja proveitoso escrever a Equação (16.74) em forma matricial, com A = (a;;): 
b = c — AAc = (1 — \A)c, (16.76a) 
ou? 
c = (1 — àA)“tb. (16.76b) 
A Equação (16.76a) é equivalente a um conjunto de equações algébricas lineares simultâneas 
(1 =: Ami)c = Aa1202 Ee Aa13c3 >= bi, 
— \a21 C1 + (1 Aao9)c2 — Aas3€3 E deu ba, (16.77) 
—dag1c1 — Aagoco + (1 — a33)c3 — +- = ba, e assim por diante. 
Se nossa equação integral for homogênea, [f(x) = 0], então b = 0. Para obter uma solução, igualamos o 


determinante dos coeficientes de c; a zero, 
H—AA|=0, (16.78) 


exatamente como na Seção 3.5. As raízes da Equação (16.78) dão nossos autovalores. Substituindo em 
(1 — AAJe = 0, achamos os e c; e, então, a Equação (16.73) dá nossa solução. 


Note a similaridade com a forma de operador da série de Neumann. 
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Exemplo 16.3.2 


Para ilustrar essa técnica para determinar autovalores e autofunções da equação homogênea de Fredholm, 
consideramos o caso 


(x) = afa + x)y(t) dt. (16.79) 


Aqui (compare com as Equações (16.71) e (16.77)) 


A Equação (16.75) dá como resultado 
a11 = a22 = 0, an= 5, a21 = 2; bi =0= b. 


A Equação (16.78), nossa equação secular, se torna 


1 2A 
3 |1=0. (16.80) 
—2A 1 
Expandindo, obtemos 
4x? v3 
l1- — = =+t—. 16.81 
3 0, A 3 (16.81) 
Substituindo os autovalores À = +/3/2 na Equação (16.76), temos 
C2 
& F — =0. 16.82 
tA ( ) 
Por fim, escolhendo cı = 1, a Equação (16.73) resulta em 
3 3 
p(x) = “i +32) à= e (16.83) 
3 3 
pola) = a vão, jato, (16.84) 
Uma vez que nossa equação é homogênea, a normalização de y(x) é arbitrária. E 


Se o núcleo não for separável no sentido da Equação (16.70), ainda há a possibilidade de que ele possa ser 
aproximado por um núcleo que é separável. A solução exata de uma equação aproximada, uma 
equação que aproxima a equação original. Então a solução do problema do núcleo aproximado separável 


pode ser verificada substituindo de volta no problema original do núcleo inseparável. 


Solução Numérica 

Há literatura extensiva sobre a solução numérica de equações integrais, e grande parte dela dedica-se a técnicas 
especiais para certas situações. Um método de razoável generalidade é a substituição da única equação integral 
por um conjunto de equações algébricas simultâneas. E, mais uma vez, são invocadas técnicas matriciais. Aqui, 
essa abordagem de matriz da equação algébrica simultânea é aplicada a dois casos diferentes. Para a equação 
homogênea de Fredholm de segunda espécie, esse método funciona bem. Para a equação de Fredholm de primeira 
espécie, o método é um desastre. Primeiro vamos tratar do desastre. 

Consideramos a equação integral de Fredholm de primeira espécie, 


b 
Ho)= | Ko ode (16.844) 
com f(x) e K(a,t) conhecidas e y(t) desconhecida. A integral pode ser avaliada (em princípio) por técnicas de 


quadratura. Para precisão máxima recomenda-se o método gaussiano (se o núcleo for contínuo e tiver derivadas 
contínuas). A quadratura numérica substitui a integral por um somatório, 


F(z) = XO AK(zite)olte), (16.84b) 
k=l 
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sendo Ay os coeficientes de quadratura. Abreviamos f(x;) como fi, (ty) como yp e Ak K (zi, tk) como Bip. 
Na verdade, estamos mudando de uma descrição de função para uma descrição de matriz vetorial, com as n 
componentes do vetor ( f;) definidas como os valores da função nos n pontos discretos [f (x;)]. A Equação (16.84b) 
se torna 


fi= So, BkPp» 
k=1 


uma equação matricial. Invertendo (Bix), obtemos 
plo) = Pk => Bir fis (16.840) 
k=1 


e a Equação (16.84a) é resolvida em princípio. Na prática, a matriz de quadratura coeficientes-núcleo costuma ser 
“malcondicionada”(em relação à inversão). Isso significa que no processo de inversão pequenos erros (numéricos) 
são multiplicados por grandes fatores. No processo de inversão todos os algarismos significativos podem ser 
perdidos e a Equação (16.84c) se torna um absurdo numérico. 

Esse desastre não deveria ser de todo inesperado. A integração é, em essência, uma operação de ajuste. f(x) é 
relativamente insensível à variação local de y(t). Ao contrário, p(t) pode ser extremamente sensível a pequenas 
mudanças em f(x). Pequenos erros em f(x) ou em Bt são aumentados e a precisão desaparece. Esse mesmo 
comportamento aparece em tentativas de inverter transformadas de Laplace por métodos numéricos. 

Quando a técnica de quadratura de matriz é aplicada ao problema do autovalor da equação integral, a equação 
de Fredholm homogênea de núcleo simétrico de segunda espécie, 


b 
aaa) = f K(x, t)p(t) dt, (16.84d) 


o sucesso da técnica é muito maior. Substituindo a integral por um conjunto de equações algébricas simultâneas 
(quadratura numérica), temos 


AP: = X Ak KikYr, (16.84e) 
k=1 
com Y; = (xi), como antes. Os pontos x;, i = 1,2,...,n, são considerados os mesmos (numericamente) que 
tk, k = 1,2,...,n, portanto Kip será simétrico. O sistema é simetrizado multiplicando por A / 2, de modo que 
MA o) = X (A KA) (A). (16.849) 
k=1 


Substituindo Ao, por y; e AP Kip Al? por Sik, obtemos 
Ay = Sy, (16.84g) 


com S simétrico (uma vez que admitimos que o núcleo K(x,t) é simétrico). É claro que 1) tem componentes 
vb; = W(x;). A Equação (16.84g) é nossa equação matricial de autovalor, Equação (3.136). Os autovalores são 
obtidos imediatamente chamando uma auto-rotina de prateleira.” Para núcleos tais como os do Exercício 16.3.15 
e usando uma quadratura de Gauss-Legendre de 10 pontos, a auto-rotina determina o maior autovalor até cerca de 
0,5% para os casos em que o núcleo tem descontinuidades em suas derivadas. Se as derivadas forem contínuas, a 
precisão é muito maior. 

Linzé descreveu um interessante refinamento variacional na determinação de Amáx com alta precisão. A chave 
para esse método é o Exercício 17.8.7. As componentes do vetor autofunção são obtidas pela Equação (16.84d) 
com (ty) agora conhecida e y; = y(x:;) gerada como requerido. (Os x; não estão mais vinculados aos tp.) 


40 autovalor À foi escrito do lado esquerdo, multiplicando a autofunção, como é costumeiro em análise matricial (Seção 3.5). Nessa forma, 
À assumirá um valor máximo. 

Veja W. H. Press, B. P. Flannery, S. A. Teukolsky, e W. T. Vetterling, Numerical Recipes, 2% ed., Cambridge, UK: Cambridge University 
Press (1992), Capítulo 11, para detalhes, referências e códigos de computador. Os softwares simbólicos Mathematica e Maple também incluem 
funções matriciais para cálculo de autovalores e autovetores. 

6P. Linz, On the numerical computation of eigenvalues and eigenvectors of symmetric integral equations. Math. Comput. 24: 905 (1970). 
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Exercícios 
16.3.1 Usando a série de Neumann, resolva 
(a) y(x)=1— a! to(t) dt, 
0 
O ela) =2+ | E- aol) de 
0 
© pa) =2- f (t-al) de 
0 
Resposta: (a) o(a) = em 
16.3.2 Resolva a equação 
1 1 
(x) = x + > / (t+ x)y(t) dt 
—1 
pelo método do núcleo separável. Compare com a solução do método de Neumann da Seção 16.3. 
Resposta: p(x) = 5(3x — 1). 
16.3.3 Ache os autovalores e autofunções de 
1 
elo) =A | (t- ajale) dt 
= 
16.3.4 Ache os autovalores e autofunções de 
27 
g(x) = af cos(x — t)y(t) dt. 
0 
Resposta: À = Ap = 4, g(x) = Acosa + Bsena. 
16.3.5 Ache os autovalores e autofunções de 
1 
na) =à | (o Puto) dt 
—1 
Sugestão: Esse problema pode ser tratado pelo método do núcleo separável ou por uma expansão 
de Legendre. 
16.3.6 Se a técnica do núcleo separável desta seção for aplicado à equação de Fredholm de primeira espécie 
(Equação (16.1)), mostre que a Equação (16.76) é substituída por 
c= Ab. 
Em geral, a solução para a y(t) desconhecida não é única. 
16.3.7 Resolva 
1 
p(s) = +f (1+ zt)y(t)dt 
0 
por cada um dos métodos seguintes: 
(a) a técnica da série de Neumann, 
(b) a técnica do núcleo separável, 
(c) palpite calibrado. 
16.3.8 Use a técnica de núcleo separável para mostrar que 


p(z) = fo cos zsen ty(t) dt 


não tem nenhuma solução (à parte a trivial Yy = 0). Explique esse resultado em termos de 
separabilidade e simetria. 


ELSEVIER 
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16.3.9 


16.3.10 


16.3.11 


16.3.12 


16.3.13 


16.3.14 


16.3.15 


Resolva A 
pla) =1+ x f (x — lt) dt 
(0) 


por cada um dos métodos seguintes: 


(a) redução a uma EDO (ache as condições de fronteira), 
(b) a série de Neumann, 
(c) a utilização de transformadas de Laplace. 


Resposta: y(x) = cosh Ag. 
(a) Na Equação (16.69a) considere V = Vo, independente de t. Sem usar a Equação (16.69b), 
mostre que a Equação (16.69a) leva diretamente a 


i 


E] Ft tovo. 


(b) Repita para a Equação (16.69b) sem usar a Equação (16.69a). 


Dada (x) = à ha + xt)y(t) dt, resolva para os autovalores e as autofunções pela técnica do 
núcleo separável. 


Conhecer a forma das soluções pode ser uma grande vantagem. Para a equação integral 


lx) = af (1+ zt)p(t) dt, 


admita que y(x) tem a forma 1 + bx. Substitua na equação integral. Integre e resolva para b e À. 


A equação integral 
p(z) = af Jolazt)p(t) dt,  Jo(a) =0, 
0 
é aproximada por 
(x) = NE [1 — 2P] p(t) dt. 
0 
Ache o mínimo autovalor À e a autofunção correspondente p(t) da equação aproximada. 


Resposta: Amín = 1,112486, (x) = 1 — 0, 3033372x. 


Dada a equação integral 
1 
g(x) = 1 sen muty(t) dt. 
0 
Aproxime o núcleo por 
K(a,t) = 4xt(l — at) = sen mat. 


Ache o autovalor positivo e a autofunção correspondente para a equação integral aproximada. 
Nota: Para K(ax,t) = sen rat, À = 1,6334. 


Resposta: À = 1,5678, y(x) =x — 0, 6955x? 
(A4 = V31 — 4, à- = —v31 — 4). 
A equação 


b 
fa) = i K(x, t)o(t) dt 


tem um núcleo degenerado K (x,t) = 374 Mi(a)N;(t). 


(a) Mostre que essa equação integral não tem nenhuma solução simples, a menos que f(x) possa 
ser escrita como 


f(x) = 2 fiMi(a), 


com os fi constantes. 
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(b) Mostre que podemos adicionar y(x) a qualquer solução y(x), contanto que 1)(x:) seja ortogonal 
a todos as N;(x): 
b 
i Ni(a)yp(x) de = 0 para todo i. 
16.3.16 Usando quadratura numérica, converta 
1 
em) = f Jolant)a(t)dt, Jla) =0, 
0 
a um conjunto de equações lineares simultâneas. 
(a) Ache o mínimo autovalor À. 
(b) Determine y(x) em valores discretos de x e construa um gráfico de y(x) versus x. Compare 
com a autofunção aproximada do Exercício 16.3.13. 
Resposta: (a) Amín = 1, 14502. 
16.3.17 Usando quadratura numérica, converta 
1 
lx) = af senmaxty(t) dt 
0 
a um conjunto de equações lineares simultâneas. 
(a) Ache o mínimo autovalor À. 
(b) Determine y(x) em valores discretos de x e construa um gráfico de y(x) versus x. Compare 
com a autofunção aproximada do Exercício 16.3.14. 
Resposta: (a) Amin = 1, 6334. 
16.3.18 Dada uma equação homogênea de Fredholm de segunda espécie 


eta) = f K(x,t)p(t) dt. 


(a) Calcule o maior autovalor Ao. Use a iécmca de quadratura de Gauss-Legendre de 10 pontos. 
Para comparação, os autovalores listados por Linz são dados como Aexato- 

(b) Tabule (xy), em que os xy são os 10 pontos de avaliação em [0, 1]. 

(c) Tabule a razão 


1 1 
— K(x,t)y(t) dt ara £ = Tk- 
og KODd paras = 


Esse é o teste para saber se você realmente tem ou não uma solução. 
(a) K(x,t) = et, 
Resposta: Aoxato = 1, 35303. 
ly(2 — t), x<t, 
O) K(x)=4 
Resposta: Aexato = 0, 24296. 
(©) K(x,t) = |x — tl. 
Resposta: Aoxato = 0, 34741. 
T; £< t, 
(d) K(x,t) = 
t, v>t. 
Resposta: Aoxato = 0, 40528. 


Nota: (1) Os pontos de avaliação x; da quadratura de Gauss-Legendre para [—1,1] podem ser 
transformados linearmente para [0, 1], 


Então os fatores de ponderação A; são reduzidos proporcionalmente ao comprimento do intervalo: 
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16.3.19 Usando a técnica da matriz variacional do Exercício 17.8.7, refine seu cálculo do autovalor do 
Exercício 16.3.18(c) [K(a,t) = |x — t|]. Tente uma matriz 40 x 40. 
Nota: Sua matriz deve ser simétrica, de modo que os autovetores (desconhecidos) serão ortogonais. 


Resposta: (quadratura de Gauss-Legendre de 40 pontos) 0,34727. 


16.4 Teoria de Hilbert-Schmidt 


Simetrização de Núcleos 
Esse é o desenvolvimento das propriedades de equações integrais lineares (do tipo de Fredholm) com núcleos 
simétricos: 

K(e,t) = K(t,a). (16.85) 
Antes de mergulhar na teoria, observamos que alguns importantes núcleos não-simétricos podem ser simetrizados. 
Se tivermos a equação 


b 
de) = fo) + ri Ele, (btt) dt, (16.86) 


o núcleo total é, na verdade, K (x, t)o(t), claramente não-simétrico se apenas K (x,t) for simétrico. Contudo, se 
multiplicarmos a Equação (16.86) por ,/p(x) e substituirmos 


plx)pla) = bla), (16.87) 


obtemos 


b 
da) = PO(a) + À J [K (æ, t) VPE |Y) dt, (16.88) 


com um núcleo total simétrico K (x, t)./p(x) p(t). Encontraremos p(x) mais adiante como um fator de ponderação 
positivo nessa teoria da equação integral de Sturm-Liouville. 


Funções Ortogonais 
Agora focalizamos a equação homogênea de Fredholm de segunda espécie: 


b 
(x) = af K(x, t)p(t) dt. (16.89) 


Admitimos que o núcleo K(x, t) é simétrico e real. Talvez uma das primeiras perguntas que poderíamos fazer 
sobre essa equação fosse: “Ela faz sentido?” ou, mais exatamente, “Existe um autovalor À que satisfaz essa 
equação?” Com a ajuda das desigualdades de Schwarz e Bessel, Capítulo 10, e Courant e Hilbert (Capítulo II, 
Seção 4, — veja as Leituras Adicionais), mostre que, se K (x, t) é contínuo, existe pelo menos um autovalor desses 
e possivelmente um número infinito deles. 

Mostramos que os autovalores, À, são reais e que as autofunções correspondentes, ;(x:), são ortogonais. 
Sejam A;, A; os dois autovalores diferentes e ;(x), P;(x) as duas autofunções correspondentes. Então, a 
Equação (16.89) se torna 


b 
ali = f kenana: (16.90a) 


b 
p(x) = xf K(x, t)p;(t) dt. (16.90b) 


Se multiplicarmos a Equação (16.90) por A;y;(x) e a Equação (16.90b) por A;y;(x) e então integrarmos em 
relação a x, as duas equações se tornam” 


b b pb 
» f edeeado= a | | Kæ Dae dede, (16.914) 


b b pb 
af aaa f | Ketel) dtde, (16.91b) 


7 Admitimos que as integrais necessárias existem. Se o leitor quiser um exemplo de um caso patológico simples, veja o Exercício 16.4.3. 
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Uma vez que impusemos que K(x, t) é simétrico, a Equação (16.91b) pode ser reescrita como 


b b pb 
af aaea de = zy f | Keelel) tdo. (1692) 


Subtraindo a Equação (16.92) da Equação (16.91a), obtemos 


b 
(A; — ~) f pila)p;(a) dx = 0. (16.93) 


Essa expressão tem a mesma forma das Equações (10.34) na teoria de Sturm-Liouville. Uma vez que A; £ Aj, 


b 
f pilx)p;(x) dr = 0, E), (16.94) 


o que prova a ortogonalidade. Note que, com um núcleo simétrico real, não há nenhum complexo conjugado 
envolvido na Equação (16.94). Para o núcleo auto-adjunto ou hermitiano, veja o Exercício 16.4.1. 

Se o autovalor À; for degenerado,’ as autofunções para esse autovalor particular podem ser ortogonalizadas 
pelo método de Gram-Schmidt (Seção 10.3). Claro que nossas autofunções ortogonais podem ser normalizadas, e 
admitimos que isso foi feito. O resultado é 


b 
f pilx)p;(£) dx = ĝij. (16.95) 


Para demonstrar que os A; são reais, precisamos admitir conjugados complexos. Considerando o conjugado 
complexo da Equação (16.90a), temos 


b 
HOEN 1 K(x, te} (t) dt, (16.96) 


contanto que o núcleo K(x, t) seja real. Agora, usando a Equação (16.96) em vez da Equação (16.90b), vemos que 
a análise leva a 


b 
A-A) f oleam de =. (16.97) 
Dessa vez a integral não pode desaparecer (a menos que tenhamos a solução trivial y;(x) = 0) e 
A; = Ai, (16.98) 


ou À;, nosso autovalor, é real. 

Essa é a terceira vez que trilhamos esse caminho, a primeira com matrizes hermitianas, depois com as EDOs 
(auto-adjuntas) de Sturm-Liouville, e agora com as equações integrais de Hilbert-Schmidt. A correspondência entre 
as matrizes hermitianas e as EDOs auto-adjuntas aparece em física como as duas formulações notáveis da Mecânica 
Quântica — a abordagem da matriz de Heisenberg e a abordagem do operador diferencial de Schrödinger. Na Seção 
17.8 e no Exercício 17.7.6 vamos explorar mais a correspondência entre as equações integrais de núcleo simétrico 
de Hilbert-Schmidt e as equações diferenciais auto-adjuntas de Sturm-Liouville. 

As autofunções de nossas equações integrais formam um conjunto completo,” no sentido de que qualquer função 
g(x) que possa ser gerada pela integral 


g(x) = J K(x, t)h(t) dt, (16.99) 


na qual h(t) é qualquer função contínua parte por parte, pode ser representada por uma série de autofunções, 


glx) => anpa (2). (16.100) 
n=1 


8Se mais de uma autofunção distinta corresponder ao mesmo autovalor (satisfazendo a Equação (16.89), diz-se que esse autovalor é 
degenerado (veja os Capítulos 3 e 4). 
Se quiser uma prova dessa afirmação, o leitor deve consultar Courant e Hilbert (1953), Capítulo III, Seção 5, nas Leituras Adicionais. 
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A série converge uniforme e absolutamente. 
Vamos estender isso ao núcleo K (x, t), assegurando que 


K(x,t) = X angr (t), (16.101) 
n=1 


e an = an(x). Substituindo na equação integral original (Equação (16.89)) e usando a integral de ortogonalidade, 
obtemos 
pila) = Ajai(a). (16.102) 


Por conseguinte, para nossa equação homogênea de Fredholm de segunda espécie, o núcleo pode ser expresso em 
termos das autofunções e autovalores por 


= t 
K(x,t) = 5 o (zero não sendo um autovalor). (16.103) 
n=1 1 


Aqui temos uma expansão bilinear, uma expansão linear em y, (x) e linear em y, (t). Expansões bilineares 
semelhantes aparecem na Seção 9.7. E possível que a expansão dada pela Equação (16.101) talvez não exista. 
Como ilustração do tipo de comportamento patológico que pode ocorrer, convidamos o leitor a aplicar essa análise 
a 


FS f ~ e p(t) dt 


(compare com o Exercício 16.4.3). 

Devemos salientar que essa teoria de Hilbert-Schmidt refere-se ao estabelecimento de propriedades dos 
autovalores (reais) e autofunções (ortogonalidade, completude), propriedades que podem ser de grande interesse 
e valor. A teoria de Hilbert-Schmidt não resolve a equação integral homogênea para nós, assim como a teoria de 
Sturm-Liouville tampouco resolvia as EDOs do Capítulo 10. As soluções da equação integral vêm das Seções 16.2 
e 16.3 (incluindo análise numérica). 


Equação Integral Não-Homogênea 
Precisamos de uma solução da equação linear não-nomogênea 


b 
(x) = f(x) + af K(x, t)p(t) dt. (16.104) 
Vamos admitir que as soluções da equação integral homogênea correspondente são conhecidas: 
b 
Pnl) = Mm K(x,t)pn(t) dt, (16.105) 


sendo que a solução «o, (1) corresponde ao autovalor An. Expandimos y(x) e f(x) em termos desse conjunto de 
autofunções: 


(x) = 5 anPn lT) (an desconhecida), (16.106) 
n=1 

fæ) =X baynlz) (bn conhecida). (16.107) 
n=1 


Substituindo na Equação (16.104), obtemos 


oo oo b oo 
5 annl) = 5 baPn(a) + af K(a,t) 5 AnPn(t) dt. (16.108) 
n=1 4 n=l 


n=1 


Permutando a ordem de integração e somatório, podemos avaliar a integral pela Equação (16.105), e obtemos 


DS antena) =D) bngale) + AD) a (16.109) 
n=1 n=1 n=1 qu 
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Se multiplicarmos y;(x) e integrarmos de x = a a x = b, a ortogonalidade de nossas autofunções leva a 


ai = br Aço (16.110) 
Essa expressão pode ser reescrita como 
ai = bi + ti (16.111) 
que nos leva à nossa solução Ea 
pla) = f(x) + e AOAO E a), (16.112) 


Aqui, admitimos que as autofunções p;(x) são normalizadas para unidade. Note que, se f(x) = 0, não há 
nenhuma solução simples, a menos que, À = A;. Isso significa que nossa equação homogênea não tem nenhuma 
solução (exceto a trivial y(x) = 0), a menos que À seja um autovalor, A;. 

Caso À para a equação não-homogênea (16.104) seja igual a um dos autovalores A, da equação homogênea, 
nossa solução (Equação (16.112)) explode. Para reparar o dano, voltamos à Equação (16.110) e damos especial 
atenção ao valor 


ap = bp + Ap = bp + ap (16.113) 


É claro que ap é descartado e não é mais determinado por bp, enquanto bp = O. Isso implica que 
J Fla)pp(x) de = 0; isto é, f(x) é ortogonal à autofunção p (x). Se não for esse o caso, não temos nenhuma 
solução. 

A Equação (16.111) ainda é válida para à Æ p, portanto, multiplicamos por y;(x) e somamos sobre i(i Æ p) 
para obter 


do Molde 6, (16.114) 


oo b 

o(a) = H0) + apep tA Y de E 
i=1 É p 
ip 


Nessa solução ap permanece como uma constante indeterminada.!º 


Exercícios 
16.4.1 Na equação de Fredholm 


b 
pa) =A | Kedd 
o núcleo K (x,t) é auto-adjunto ou hermitiano: 
K(x,t) = K* (t,x). 


Mostre que 


(a) as autofunções são ortogonais, no sentido de que 


b 
/ Pleno) dr=0, mAn (Am Z Àn), 


(b) os autovalores são reais. 


16.4.2 Resolva a equação integral 
1 1 
o(a) = x + 3 (i (t+ x)y(t) dt 
zi 

(compare com o Exercício 16.3.2) pelo método de Hilbert-Schmidt. 
Nota: Aqui, a aplicação da técnica de Hilbert-Schmidt equivale a usar uma espingarda para matar 
um mosquito, em especial quando a equação pode ser resolvida rapidamente por expansão em 
polinômios de Legendre. 


10Tsso é como a EDO linear não-homogênea. Podemos somar à sua solução qualquer constante vezes uma solução da EDO homogênea 
correspondente. 
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16.4.4 


16.4.5 


16.4.6 


16.4.7 


Resolva a equação integral de Fredholm 


OO 
(x) = af e~“ ™ y(t) dt. 
0 
Nota: Uma expansão de série do núcleo e”! permitiria uma solução do tipo de núcleo separável 
(Seção 16.3), exceto que a série é infinita. Isso sugere um número infinito de autovalores e 
autofunções. Se você parar em 


p= Nem A 


terá perdido a maioria das soluções. Mostre que as integrais de normalização das autofunções não 
existem. Uma razão básica para esse comportamento anômalo é que a faixa de integração é infinita, 
o que faz disso uma integral “singular”. 


Dada i 
ylz) = « + af aty(t) dt. 
0 


(a) Determine y(x) como uma série de Neumann. 
(b) Ache o intervalo de À para o qual sua solução de série de Neumann é convergente. Compare 
com o valor obtido de 
AL: |K máx < 1. 
(c) Ache o autovalor e a autofunção da equação integral homogênea correspondente. 
(d) Pelo método do núcleo separável, mostre que a solução é 


y(x) = 30) 


(e) Ache y(x) pelo método de Hilbert-Schmidt. 
No Exercício 16.3.4, 

K(a,t) = cos(x — t). 
As autofunções (não-normalizadas) são cos x e sen x. 


(a) Mostre que há uma função h(t), tal que K(x, s), considerada como uma função de s apenas, 


pode ser escrita 
27 


K(x,s) = K(s,W)h(t) dt. 


(b) Mostre que K (x,t) pode ser expandida como 
2 
Pn lE) Pnt) 
K(x,t) = m 
(x, ) 2 Na 


A equação integral y(x) = Aha + xt)p(t) dt tem autovalores A = 0,7889 e A» = 15, 211 e 
autofunções yı = 1 + 0, 5352x e p = 1 — 1,86857. 

(a) Mostre que essas autofunções são ortogonais no intervalo [0, 1]. 

(b) Normalize as autofunções para unidade. 

(c) Mostre que 


K(a,t) = Ae (o Pala)po(t) 


Resposta: (b) pı (x) = 0, 7831 + 0,4191x 
Polar) = 1,8403 — 3, 4386x. 
Uma forma alternativa de solução para a equação integral não-nomogênea, Equação (16.104), é 


OO 


dlo)= 5 ES eia) 
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(a) Derive essa forma sem usar a Equação (16.112). 
(b) Mostre que essa forma e a Equação (16.112) são equivalentes. 


16.4.8 (a) Mostre que as autofunções do Exercício 16.3.5 são ortogonais. 
(b) Mostre que as autofunções do Exercício 16.3.11 são ortogonais. 


Leituras Adicionais 
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Cálculo de Variações 


Usos do Cálculo de Variações 

Agora abordaremos problemas nos quais procuramos uma função ou curva em vez de um valor de alguma variável, 

que converta alguma quantidade dada em estacionária, usualmente uma integral de energia ou ação. Como uma 

função é variada, esses problemas são denominados variacionais. Princípios variacionais, como os de D’ Alembert 

e Hamilton, foram desenvolvidos na Mecânica Clássica, e técnicas de Lagrange ocorrem na Mecânica Quântica e 

na Teoria de Campo, por exemplo, o princípio de Fermat do caminho óptico mais curto em eletrodinâmica. Antes 

de mergulhar nesse ramo bastante diferente da Física Matemática, vamos resumir alguns de seus usos tanto na 

Física quanto na Matemática. 

1. Em teorias físicas existentes: 

a. Unificação de diversas áreas da Física usando energia como um conceito fundamental. 
b. Conveniência na análise, equações de Lagrange, Seção 17.3. 
c. Tratamento elegante de restrições, Seção 17.7. 

2. Ponto de partida para novas e complexas áreas da Física e da Engenharia. Em Relatividade Geral, a 
geodésica é considerada a trajetória mínima de um pulso de luz ou o caminho de queda livre de uma partícula no 
espaço curvo de Riemann (veja geodésicas na Seção 2.10). Princípios variacionais aparecem na teoria quântica 
de campo. Princípios variacionais são aplicados extensivamente na teoria do controle. 

3. Unificação matemática. A análise variacional fornece uma prova da completude das autofunções de Sturm- 
Liouville, Capítulo 10, e estabelece um limite inferior para os autovalores. Resultados semelhantes são obtidos 
para os autovalores e autofunções da equação integral de Hilbert-Schmidt, Seção 16.4. 

4. Técnicas de cálculo, Seção 17.8. Cálculo das autofunções e autovalores da equação de Sturm-Liouville. 
Autofunções e autovalores de equação integral podem ser calculados usando quadratura numérica e técnicas 
de matrizes, Seção 16.3. 


17.1 Uma Variável Dependente e uma Variável Independente 


Conceito de Variação 

O cálculo de variações envolve problemas nos quais a quantidade a ser minimizada (ou maximizada) aparece como 
uma integral estacionária, um funcional, porque uma função y(x, œ) precisa ser determinada a partir de uma classe 
descrita por um parâmetro infinitesimal a. Como o caso mais simples, seja 


J= IM F(Y, Yz, £) de. (17.1) 


Aqui, J é a quantidade que assume um valor estacionário. Sob o sinal de integral, f é uma função conhecida das 
variáveis x e a, indicadas, assim como y(x, &), Yz(x,a) = ôy(x,a)/dx, mas a dependência de y de x (e de 
a) ainda não é conhecida; isto é, y(x) é desconhecida. Isso significa que, embora a integral seja de xı a 15,0 
caminho de integração exato não é conhecido (Figura 17.1). Temos de escolher o caminho de integração passando 
pelos pontos (£1, y1) e (x2,%y>), de modo a minimizar J. Em termos estritos, determinamos valores estacionários 
de J: mínimos, máximos ou pontos de sela. Na maioria dos casos de interesse para a Física, o valor estacionário 
será um mínimo. Esse problema é consideravelmente mais difícil do que o problema correspondente de uma função 
y(x) em cálculo diferencial. Na verdade, pode não haver nenhuma solução. Em cálculo diferencial, o mínimo é 
determinado comparando y(x0) com y(x), em que x se estende a pontos vizinhos. Aqui, admitimos a existência 
de um caminho ótimo, isto é, um caminho aceitável para o qual J é estacionária, e então comparamos J para nosso 
caminho ótimo (desconhecido) com a obtida de caminhos vizinhos. Dois caminhos possíveis são mostrados na 


787 
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Figura 17.1. (Há um número infinito de possibilidades.) A diferença entre esses dois para um dado x é denominada 
variação de y, dy e é convenientemente descrita introduzindo uma nova função, n(x), para definir a deformação 
arbitrária do caminho, e um fator de escala, a, para dar a grandeza da variação. A função n(x) é arbitrária, exceto 
por duas restrições. A primeira, 


y 


Figura 17.1: Um caminho variado. 


n(zı) = n(x2) = 0, (17.2) 


que significa que todos os caminhos variados devem passar pelos pontos extremos fixos. A segunda, como veremos 
em breve, é que n(x) deve ser diferenciável; isto é, não podemos usar 


n(x) E l,  &%= fo, (17.3) 


mas podemos escolher que n(x) tenha uma forma similar às funções usadas para representar a função delta de 
Dirac (Capítulo 1), de modo que n(x) seja diferente de zero somente em uma região infinitesimal.! Então, com o 
caminho descrito por a e n(x), 

y(x,a) = y(x,0) + an(x) (17.4) 


Vamos escolher y(x, œ = 0) como o caminho desconhecido que minimizará J. Então, y(x, œ) para a não-zero 
descreve um caminho vizinho. Na Equação (17.1), J agora é uma função? de nosso parâmetro a: 


T2 
J(a) = J Fly(x, a), ya(z,a), 2] dz, (17.6) 
zı 
e nossa condição para um valor extremo é que 
ze = 0, (17.7) 
da a=0 


análoga quando se anula a derivada dy/dx em cálculo diferencial. 


!Compare com H. Jeffreys e B. S. Jeffreys, Methods of Mathematical Physics, 3% ed., Cambridge, UK: Cambridge University Press (1966), 
Capítulo 10, se quiser uma discussão mais completa desse ponto. 
2Tecnicamente, J é uma funcional de y, yz, mas uma função de a: dependendo das funções y(x, a) e yr(2,0) : Jly(x, a), yz (x, a)]. 
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Agora, a dependência de a da integral está contida em y(x, œ) e yz(x, œ) = (0/0x)y(x, æ). Por conseguinte, 


9J(a) Fr Of dy Of Oy 
= dz. 17. 
da zı Ly da j 3yr da z GLB 
Pela Equação (17.4), 
y(x, a 
duma) L nfa), (17.9) 
Əyz(x,a) _ dn(z) 
da Ed (17.10) 
portanto, a Equação (177.8) se torna 
9J(a) ” (of of dn(x) 
eR == dz. 17.11 
da S (ra) i Oya dx o ( ) 
Integrando o segundo termo por partes para obter m(x:) como um fator arbitrário e comum que não desaparece, 
obtemos (a) Ə 5 3 
OE T d of 
L de O da = 1) am MAE A NO) dy, da. (17.12) 


A parte integrada desaparece pela Equação (17.2), e a Equação (17.11) se torna 
“210 d O 
f [5 — t] n(x) de = 0. (17.13) 
zı 


Nessa forma a foi igualada a zero, o que corresponde ao caminho, solução e, na verdade, já não é mais parte do 
problema. 
Ocasionalmente, veremos a Equação (17.13) multiplicada por da, o que resulta, usando n(x)da = dy, 


“2 /0f d Of o ðJ Ea 
A (Z — dar iude= dade] 830. (17.14) 


1 


Visto que n(x) é arbitrária, podemos escolher que ela tenha o mesmo sinal da expressão entre colchetes na 
Equação (17.13) toda vez que esta última for diferente de zero. Por conseguinte, o integrando é sempre não- 
negativo. Então, a Equação (17.13), nossa condição para a existência de um valor estacionário, só pode ser satisfeita 
se, e somente se, o próprio termo entre chaves for zero em quase todos os lugares. Assim, a condição para nosso 
valor estacionário é uma EDP? 


E ae a (17.15) 


conhecida como a equação de Euler, que pode ser expressa em várias outras formas. Às vezes omitimos soluções 
quando elas não são diferenciáveis duas vezes, como requer a Equação (17.15). Um exemplo é a solução 
descontínua de Goldschmidt da Seção 17.2. É claro que a Equação (17.15) deve ser satisfeita para que J adquira 
um valor estacionário, isto é, para que a Equação (17.14) seja satisfeita. A Equação (17.15) é necessária, mas não 
é, de modo algum, suficiente.” Courant e Robbins (1996; veja as Leituras Adicionais) ilustram isso muito bem, 
considerando a distância em uma esfera entre pontos sobre a esfera, Ae B, Figura 17.2. O caminho (1), um grande 
círculo, é encontrado pela Equação (177.15). Mas o caminho (2), o restante do grande círculo que passa pelos pontos 
A e B, também satisfaz a equação de Euler. O caminho (2) é um máximo, mas somente se exigirmos que ele seja 
um grande círculo e, ainda assim, só se fizermos menos do que um circuito; isto é, o caminho (2) +n revoluções 


Note que y e yx estão sendo tratadas como variáveis independentes. 
“É importante prestar muita atenção no significado de 9/0x e d/dx. Por exemplo, se f = fly(x), yx, x], 
df Of Ofdy | Of dy 


de Ox ydr Oy da? 


O primeiro termo da direita dá a dependência explícita de x. Os segundo e terceiro termos dão a dependência implícita de x por meio de yzy. 

Se o leitor quiser uma discussão de condições suficientes e do desenvolvimento do cálculo de variações como uma parte da Matemática, 
consulte G. M. Ewing, Calculus of Variations with Applications, Nova York: Norton (1969). Condições de suficiência também são tratadas por 
Sagan (veja as Leituras Adicionais no final deste capítulo). 
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completas também é uma solução. Se não for exigido que o caminho seja um grande círculo, qualquer desvio em 
relação a (2) aumentará o comprimento. Dificilmente essa é a propriedade de um máximo local, e por isso ela é 
importante para verificar as propriedades de soluções da Equação (17.15) para ver se elas satisfazem as condições 
físicas do problema dado. 


Figura 17.2: Caminhos estacionários sobre uma esfera. 


Exemplo 17.11 CAMINHO ÓPTICO PERTO DO HORIZONTE DE EVENTOS DE UM BURACO NEGRO 


Determine o caminho óptico em uma atmosfera onde a velocidade da luz aumenta proporcionalmente à altura, 
v(y) = y/b, sendo b > 0 algum parâmetro que descreve a velocidade da luz. Portanto, v = 0 em y = 0,0 
que simula as condições na superfície de um buraco negro, denominado seu horizonte de eventos, onde a força 
gravitacional é tão forte que a velocidade da luz vai a zero, o que não a deixa escapar. 

Como a luz leva o tempo mais curto, o problema variacional assuma a forma 


ta d da? + dy? 
at= f d= f E =o | EE ap = minimo. 
tá v y 


Aqui, v = ds/dt = y/b é a velocidade da luz nesse ambiente, sendo a coordenada y a altura. Um exame 
da funcional variacional sugere escolher y como a variável independente porque x não aparece no integrando. 
Podemos trazer dy para fora do radical e mudar o papel de x e y em J da Equação (17.1) e a equação de Euler 
resultante. Com x = z(y), x” = dx /dy, obtemos 


Jea 
y 


dy = mínimo, 


e a equação de Euler se torna 


Visto que 0f/dx = 0, essa expressão pode ser integrada, dando como resultado 


x! 


y (22 +1 


Separando da e dy nessa EDO de primeira ordem, achamos a integral 
/ E I ” _Cıydy 
da = 1, 
1 — C?y? 


—1 
RS ig 1 — C?y? ou (£r +02? +y = 


= Cı = constante ou x? = Ciy (x? +1). 


que resulta em 
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Essa é uma trajetória circular da luz com centro no eixo x ao longo do horizonte de eventos (veja a Figura 17.3). 
Esse exemplo pode ser adaptado para uma miragem (Fata Morgana) em um deserto quando o ar quente está perto 
do chão e o ar mais fresco está no alto (o índice de refração muda com a altura no ar frio em comparação com o 
ar quente), o que muda a lei da velocidade de v = y/b — vo — y/b. Nesse caso, a trajetória circular da luz não é 
mais convexa com centro no eixo x mas se torna côncava. E 


y 


Figura 17.3: Caminho óptico circular em um meio. 


Formas Alternativas das Equações de Euler 
Uma outra forma (Exercício 17.1.1) que costuma ser útil é 


Əf\ 
DE dr f- yz 1)- ] (17.16) 


Em problemas nos quais f = f(y, Yx), isto é, nos quais x não aparece explicitamente, a Equação (17.16) se 
reduz a 


d Əf\ 
— (1 = wL) =0, (17.17) 
ou 


f- a = constante. (17.18) 


Exemplo 17.1.2 Variáveis Dependentes Omitidas 


Considere o problema variacional f f(t) dt = mínimo. Aqui, r está ausente do integrando. Portanto, as equações 
de Euler se tornam 


com r = (x,y,z), portanto, fè = c = constante. Resolver essas três equações para as três incógnitas x, y, 2 
resulta em t = cı = constante. Integrar essa velocidade constante resulta em r = cit + co. Tais soluções são 
linhas retas, a despeito da natureza geral da função f. 

Um exemplo físico que ilustra esse caso é a propagação da luz em um cristal, em que a velocidade da luz depende 
das direções (do cristal), mas não de sua localização, porque um cristal é um meio homogêneo anisotrópico. O 


problema variacional 
/ ds / vi? sui 
— = | — dt = mínimo 
v v(i) 


tem a forma de nosso exemplo. Note que t não precisa ser o tempo, mas ele parametriza a trajetória da luz. E 
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Exercícios 
17.1.1 Mostre a equivalência das duas formas da equação de Euler para dy/dx = yz 0: 
of dof 0 
de dry 
e 
of d of 
f — ya =0 
dy de Oy 


17.1.2 Derive a equação de Euler expandindo o integrando 


J(a) = T flulz, a), ya(x, a), x] da 


1 


em potências de a, usando uma expansão de Taylor (Maclaurin) com y e yy como as duas variáveis 
(Seção 5.6). 

Nota: A condição estacionária é OJ(a)/da = 0, avaliada em a = 0. Os termos quadráticos em a 
podem ser úteis para estabelecer a natureza da solução estacionária (máximo, mínimo ou ponto de 
sela). 


17.1.3 | Ache a equação de Euler correspondente à Equação (17.15) se f = f(Yra, Yz, Y, £). 
de / Of d (of of 
R ta: =0, 
esposta: “772 (2) da (52) i Oy 
n(z1) = n(12) = 0, malz) = Na(22) = 0. 
17.1.4 O integrando f(y, Yz, £) da equação (17.1) tem a forma 


F(Y, Ya, 2) = file, y) + fal, y)yo- 


(a) Mostre que a equação de Euler leva a 


of Of. 


Oy ðr 


(b) O que isso implica para a dependência da integral J em relação à escolha do caminho? 


17.1.5 Mostre que a condição que 
J= f Hoy) do 


tenha um valor estacionário 


(a) leva a f(x,y) independente de y e 
(b) resulta em nenhuma informação sobre qualquer dependência de x. 


Não obtemos nenhuma solução (contínua, diferenciável). Para ser um problema variacional 
significativo, a dependência de y ou derivadas de ordem mais alta é essencial. 
Nota: A situação mudará quando forem introduzidas restrições (compare com o Exercício 17.7.7). 


17.2 Aplicações da Equação de Euler 


Exemplo 17.21 LINHA RETA 
A aplicação mais simples da equação de Euler talvez seja na determinação da distância mais curta entre dois pontos 
no plano euclidiano xy. Uma vez que o elemento de distância é 


1/2 1/2 


ds = [(dx)? + (dy)?| “= [1 + y2] “da, (17.19) 
a distância J pode ser escrita como 
T2,Y2 T2 1/2 
J= / ds = i [1 +y] “da. (17.20) 
z1,yı Tı 
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Comparando com a Equação (17.1), vemos que 


1/2 
fU, Ya 7) = (14192) 2, (1721) 
Substituindo na Equação (17.16), obtemos 
d 1 
=0 17.22 
legal =” pn 
ou j 
= C, uma constante. (17.23) 


CF 


Essa equação é satisfeita por 
Yz = a, uma segunda constante, (17.24) 


y =ax + b, (17.25) 


que é nossa conhecida equação para uma linha reta. As constantes a e b são escolhidas de modo que a reta passe 
pelos dois pontos (x1, y1) e (£2, y2). Por conseqüência, a equação de Euler prevê que a distância mais curta” entre 
dois pontos fixos no espaço euclidiano é uma linha reta. E 

A generalização disso no espaço-tempo quadridimensional curvado leva ao importante conceito da geodésica 
em Relatividade Geral (veja a Seção 2.10). 


Exemplo 17.2.2  PerícuLa DE SABÃO 

Como uma segunda ilustração (Figura 177.4), considere que dois círculos de fios coaxiais paralelos estão conectados 
por uma superfície de área mínima, isto é, gerada pela rotação de uma curva y(x) em torno do eixo x. A curva 
deve passar por pontos extremos fixos (x1, y1) e (£2, Y2). O problema variacional é escolher a curva y(x), tal que 
a área da superfície resultante será um mínimo. 


Figura 17.4: Superfície de rotação — problema da película. 


Para o elemento de área mostrado na Figura 17.4, 
29 1/2 
dA = 2ryds = 2my(1 + ya) dz. (17.26) 
Então, a equação variacional é 


£2 
Ja f 2ry(1 + y2) de. (17.27) 


Desprezando o 27, obtemos 
1/2 


F(Y, Yz £) = y(1 + yz) (17.28) 


Tecnicamente, temos um valor estacionário. Pelo termo a? ele pode ser identificado como um mínimo (Exercício 17.2.2). 
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Uma vez que ðf /ðx = 0, podemos aplicar a Equação (17.18) diretamente e obter 


2) 1/2 2 1 
yl +y) -yu O TA T et (17.29) 
ou 
EE Ie (17.30) 
Urge O 
Elevando ao quadrado, obtemos 
2 
RE = come < a (17.31) 
j d 
M p T C1 
A =D = 17.32 
(vo) = TER: (17.32) 
Essa expressão pode ser integrada para dar 
g=cicosh É + cz. (17.33) 
c 
Resolvendo para y, temos 
y=€ cosn( E), (17.34) 
c 


e, mais uma vez, Cı € c» são determinados impondo que o co-seno hiperbólico passe pelos pontos (11,%1) 
e (x2,y2). Nossa superfície de área “mínima” é um caso especial de uma catenária de revolução ou uma 
catenóide. E 


Película de Sabão — Area Mínima 

Esse cálculo de variações contém muitas armadilhas para os desavisados. (Lembre-se de que a equação de Euler é 
uma condição necessária se admitirmos uma solução diferenciável. As condições de suficiência são bastante 
complicadas. Veja as Leituras Adicionais para detalhes.) Podemos aprender a respeitar alguns desses riscos 
considerando um problema físico específico, por exemplo, um problema de área mínima com (£1, y1) = (—x0,1), 
(£2, Y2) = (+20, 1). A superfície mínima é uma película de sabão esticada entre os dois anéis de raio unitário em 


x = +zxo. O problema é prever a curva y(x) que seria formada pela película de sabão. 
Referindo-nos à Equação (17.34), constatamos que c2 = 0 pela simetria do problema em torno de x = 0. Então, 
v=0 cost (2), C1 cosh( 22) =: (17.34a) 

C1 ca 
Se considerarmos £o = > obtemos uma equação transcendental para c1, a saber, 
1 
1 = c cosh| — ). (17.35) 
2c1 


Constatamos que essa equação tem duas soluções: cı = 0, 2350, que leva a uma curva “profunda” e cı = 0.8483, 
que leva a uma curva “achatada”. Qual das curvas será a forma assumida pela película de sabão? Antes de responder 
a essa pergunta, considere a situação física em que os anéis estão afastados, de modo que xo = 1. Então, a 
Equação (17.34a) se torna 
l=a cost( 5), (17.36) 
ca 
que não tem nenhuma solução real. O significado físico é que, à medida que os anéis de raios unitários se 
afastaram da origem, a película de sabão alcançou um ponto no qual não podia mais manter a mesma força 
horizontal sobre cada seção vertical. O equilíbrio estável não era mais possível. A película de sabão se rompeu 
(processo irreversível) e formou uma película circular sobre cada anel (com uma área total de 27 = 6,2832...). 
Essa é a solução descontínua de Goldschmidt. 
A próxima pergunta é: quão grande pode ser £o e ainda dar uma solução real para a Equação (17.34a)?” Fazendo 
or = p, se torna 
p = cosh pxo. (17.37) 


7De um ponto de vista numérico, é mais fácil inverter o problema. Escolha um valor de cy e resolva para xo. A Equação (17.34a) se torna 
zo = ci cosh™ 1 (1/c1). Essa expressão tem soluções numéricas no intervalo O < cı < 1. 
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Para achar £omáx poderíamos resolver para xo (como na Equação (17.33)) e então diferenciar em relação a p. 
Por fim, examinando a Figura 17.5, igualaríamos dxo/dp a zero. Como alternativa, a diferenciação direta da 
Equação (17.37) em relação a p teria como resultado 


c] 

1:0 l= cjcosh (2) 

0,9 l 

ss curva 
rasa 

0,7 

0,6 

0,5 

0,4 

0,3 curva 

02 profunda 

0,1 


0,1 0,2 0,3 04 055 056 057 058 


Xo 


Figura 17.5: Soluções da Equação (17.34a) para anéis de raios unitários em x = +zxọ. 


d 
1 = fao toe senh pzo. 
dp 
Como impusemos que dxo /dp se anula, temos 
1 = xosenh pro. (17.38) 


As Equações (17.37) e (17.38) podem ser combinadas para formar 


pxo = coth pxo, (17.39) 
com a raiz 
pxo = 1,1997. (17.40) 
Substituindo na Equação (17.37) ou (17.38), obtemos 
p= 1,810, cı = 0,5524 (17.41) 
e 
Zomáx = O, 6627. (17.42) 


Voltando à questão da solução da Equação (17.35) que descreve a película de sabão, vamos calcular a área 
correspondente a cada solução. Temos 


£o 4 xo 
A= ar f y(1 +y) "2 de = = i y dz (pela Equação (17.30)) 
0 o 


Ci 


zo : 2 2 
= tre | (cost =) da = re sen (222) + a] (17.43) 
0 Ci c q 


Para xo = > Equação (17.35), leva a 


cı = 0,2350 > A = 6,8456, 
cı = 0,8483 > A = 5,9917, 
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que mostra que a primeira só pode ser, no máximo, um mínimo local. Uma investigação mais detalhada (compare 
com Bliss, Calculus of Variations, Capítulo IV) mostra que essa superfície não é nem mesmo um mínimo local. 
Para xo = > a película de sabão será descrita pela curva achatada 


y = 0,8483 cosh ( (17.44) 


q 
0,8483 J` 
Essa catenóide achatada ou rasa (catenária de revolução) será um mínimo absoluto para O < xo < 0.528. Contudo, 
para 0,528 < x < 0,6627 sua área é maior do que a da solução descontínua de Goldschmidt (6,2832) e é apenas 
um mínimo relativo (Figura 17.6). 


Curva profunda 


60 Solução 
descontínua 
5,0} de Goldschmidt 
g 
ae 
40t 


Curva rasa 


0 01 02 03 04 05 06 07 08 
Xo 
Figura 17.6: Area da catenóide (anéis de raios unitários em x = +xo). 


Para uma excelente discussão dos problemas matemáticos, bem como experimentos com películas de sabão, 
referimo-nos a Courant e Robbins (1996) nas Leituras Adicionais no final do capítulo. 


Exercícios 


17.21 Uma película de sabão se estende no espaço entre dois anéis de raios unitários com centros em +xo 
sobre o eixo x e perpendicular ao eixo x. Usando a solução desenvolvida na Seção 17.2, estabeleça 
as equações transcendentais para a condição de que x, seja tal, que a área da superfície curva de 
rotação é igual à área dos dois anéis (solução descontínua de Goldschmidt). Resolva para xo (Figura 


17.7). 


Figura 17.7: Superfície de rotação. 


ELSEVIER 
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17.2.2 


17.2.3 


17.2.4 


17.2.5 


17.2.6 


17.2.7 


No Exemplo 17.2.1, expanda J[y(x,aœ)] — J[y(x, 0)] em potências de a. O termo linear em a leva 
à equação de Euler e à solução da linha reta, Equação (17.25). Investigue o termo a? e mostre que 
o valor estacionário de J, a distância em linha reta, é um mínimo. 


(a) Mostre que a integral 


1=[ E dz, com f = y(x), 


não tem valores extremos. 
(b) Se f(y, Yz, £) = y? (x), ache uma solução descontínua semelhante à solução de Goldschmidt 
para o problema da película de sabão. 


O princípio de Fermat da óptica afirma que um raio de luz seguirá a trajetória y(x) para a qual 


T2,Y2 
/ n(y, x) ds 


1541 


é um mínimo quando n é o índice de refração. Ache a trajetória do raio para yo = y = 1, 
=X = T2 = 1, se 
(a) n=, (b) n = a(y — yo), yY > yo. 
Uma partícula sem atrito se move do ponto A sobre a superfície da Terra até o ponto B, deslizando 
por um túnel. Ache a equação diferencial a ser satisfeita se o tempo de trânsito for um mínimo. 
Nota: Admita que a Terra é uma esfera que não gira, de densidade uniforme. 

Resposta: (Equação (17.15)): rpo(r? — ra?) + r3 (2a? — r?) + a?r? = 0, 

rtp =0) = ro, rely = 0) =0, r(p= p4) =a, r(p = pp) = a. 
2,.2 2 2 s “é doze 

Equação (17.18): r2 = a . = . A solução dessas equações é uma hipociclóide, gerada por um 
círculo de raio i(a — ro) que rola dentro de um círculo de raio a. Seria interessante mostrar que o 


2 
tempo de trânsito é 


(a? — rg)? 

(ag)!/2 
Para mais detalhes, veja P. W. Cooper, Am. J. Phys. 34: 68 (1966); G. Veneziano et al., ibid., p. 
701-704. 


Um raio de luz segue uma trajetória em linha reta em um primeiro meio homogêneo, é refratado em 
uma interface e então segue uma nova trajetória em linha reta no segundo meio. Use o princípio de 
Fermat da óptica para derivar a lei de refração de Snell: 


t=T 


nsen 04 = nosen 65. 


Sugestão: Mantenha os pontos (71,1) e (x2,y2) fixos e varie xo para satisfazer Fermat 
(Figura 17.8). Esse não é um problema de equação de Euler. (A trajetória da luz não é diferenciável 
em zo.) 


Uma segunda configuração da película de sabão para os anéis de raios unitários em x = +xo 
consiste em um disco circular, raio a, no plano x = 0, e duas catenóides de revolução unindo o 
disco e cada anel. Uma catenóide pode ser descrita por 


z 
v=0 cosh( + a). 
Ci 
(a) Imponha condições de contorno em x = 0 e x = zo. 


(b) Embora não seja necessário, é conveniente exigir que as catenóides formem um ângulo de 120° 
em que elas se unem ao disco central. Expresse a terceira condição de contorno em termos 
matemáticos. 

(c) Mostre que a área total de catenóides mais o disco central é 


2 2 
Aê sen ( 2 + 20s) f z], 


Ci Ci 


798 
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17.2.8 


17.2.9 


17.2.10 


17.2.11 


17.2.12 


(7) i i 


(1x5, Y2) 


Figura 17.8: Lei de Snell. 


Nota: Embora essa configuração de película de sabão seja realizável em termos físicos, a área é 
maior do que a da catenóide simples para todas as separações entre anéis para as quais ambas as 
películas existem. 


l= c cosh ( 22 + c) dy 
Resposta: (a) q (b) re tg 30º = senh cs. 
z 


a = cy coshcs, 


Para a película de sabão descrita no Exercício 17.2.7, ache (numericamente) o valor máximo de zo. 
Nota: Esse problema pede uma calculadora com funções hiperbólicas ou uma tabela de co-tangentes 
hiperbólicas. 


RES. zomáx = 0, 4078. 


Ache a raiz de pxo = cotgh pxo (Equação (17.39)) e determine os valores correspondentes de p e 
xo (Equações (17.41) e (17.42)). Calcule seus valores até cinco algarismos significativos. 


Para o problema da película de sabão de dois anéis desta seção, calcule e tabule xo, p, pleA,a 
área da película de sabão para pxo = 0, 00(0, 02)1, 30. 

Ache o valor de xo (até cinco algarismos significativos) que leva a uma área da película de sabão, 
Equação (17.43), igual a 27, a solução descontínua de Goldschmidt. 


Resposta: xo = 0, 52770. 


Ache a curva de declínio mais rápido de (0,0) a (£o, yo) para uma partícula que desliza sob 
gravidade e sem atrito. Mostre que a razão entre os tempos que a partícula leva ao longo de uma 
linha reta que une os dois pontos e os tempos que leva ao longo da curva de declínio mais rápido é 
(1+4/m?)1/2, 

Sugestão: Admita que y aumenta na descida. Use a Equação (17.18) para obter y2 = (1— c2y)/c2y, 
em que c é uma constante de integração. Então faça a substituição y = (sin? /2)/c? para 
parametrizar a ciclóide e considere (xo, yo) = (7/2c2,1/c2). 


17.3 Diversas Variáveis Dependentes 


Nosso problema variacional original, Equação (17.1), pode ser generalizado sob vários aspectos. Nesta seção 
consideramos o integrando f uma função de diversas variáveis dependentes (x), y2(x), y3(x),... todas 
dependentes de x, a variável independente. Na Seção 17.4, mais uma vez f conterá somente uma função 
desconhecida y, mas y será uma função de diversas variáveis independentes (sobre as quais integramos). Na Seção 
17.5 essas duas generalizações são combinadas. Na Seção 17.7, o valor estacionário está restrito por uma ou mais 
restrições. 

Para mais do que uma variável dependente, a Equação (17.1) se torna 


J= E Fla), gola), wo ,Yn(£), Yiz(T), as), sina (6), x] dz. (17.45) 
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Como na Seção 177.1, determinamos o valor extremo de J comparando caminhos vizinhos. Seja 
yi(z, a) = yi(x,0) + an;(x), 1=1,2,...5n, (17.46) 


com as m; independentes uma da outra mas sujeitas às restrições discutidas na Seção 17.1. Diferenciando a 
Equação (17.45) em relação a a e estabelecendo a = 0, uma vez que a Equação (17.7) ainda se aplica, obtemos 


z2 of of z 
f 3 (n + BL na) dz = 0, (17.47) 


2x 


sendo que o índice inferior x denota diferenciação parcial em relação a x; isto é, Yiv = ÔOyi/Ôx, e assim por 
diante. Novamente, cada um dos termos (0f/Ôyi)n;r é integrado por partes. A parte integrada se anula e a 


Equação (17.47) se torna 
a of d Of =» 


Uma vez que as n; são arbitrárias e independentes umas das outras, cada um dos termos na soma deve se anular 
independentemente. Temos 

of d of 

dy; dæ O(Oy;/0x) 


=0, i=1,2,...,n, (17.49) 


todo um conjunto de equações de Euler, cada uma das quais deve ser satisfeita para um valor extremo. 


Princípio de Hamilton 

A aplicação mais importante da Equação (17.45) ocorre quando o integrando f é considerado um lagrangiano L. O 
lagrangiano (para sistemas não-relativistas, veja o Exercício 17.3.5 para uma partícula relativista) é definido como 
a diferença entre as energias cinética e potencial de um sistema: 


L=T-— V. (17.50) 
Usando tempo como uma variável independente em vez de x e x;(t) como as variáveis dependentes, obtemos 
z>t, yrit), Via > i(t); 


x(t) é a localização e t; = dx;/dt é a velocidade de partícula i como uma função do tempo. Então, a equação 
ôJ = 0 é um enunciado matemático do princípio de Hamilton da Mecânica Clássica, 


t2 
af L(£1,£2,..., En, trios nit) dt = 0. (17.51) 
tı 


Em palavras, o princípio de Hamilton afirma que o movimento do sistema do tempo tı ao tempo tə é tal que 
a integral de tempo do lagrangiano L, ou ação, tem um valor estacionário. As equações de Euler resultantes 
costumam ser chamadas de equações lagrangianas do movimento, 


d ƏL ƏL 


Essas equações lagrangianas podem ser derivadas das equações do movimento de Newton, e as equações 
de Newton podem ser derivadas das equações de Lagrange. Os dois conjuntos de equações são igualmente 
“fundamentais”. 

A formulação lagrangiana tem vantagens em relação às leis newtonianas convencionais. Enquanto as equações 
de Newton são equações vetoriais, vemos que as equações de Lagrange envolvem apenas quantidades escalares. 
As coordenadas x1, <£2,... não precisam ser nenhum conjunto, padrão de coordenadas ou comprimentos. Elas 
podem ser selecionadas para se ajustar às condições do problema físico. As equações de Lagrange são invariantes 
em relação à escolha do sistema de coordenadas. As equações de Newton (em forma de componentes) não são 


8Por exemplo, poderíamos estabelecer n9 n3 na .. O, eliminando todos os termos da soma, exceto um, e então tratar n4 
exatamente como na Seção 17.1. 
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visivelmente invariantes. O Exercício 2.5.10 mostra o que acontece com F = ma resolvida em coordenadas 
polares esféricas. 

Explorando o conceito de energia, podemos estender com facilidade a formulação lagrangiana da Mecânica para 
diversas áreas, tais como redes elétricas e sistemas acústicos. Extensões para o Eletromagnetismo aparecem nos 
exercícios. O resultado é uma unidade de áreas da Física que, caso contrário, seriam separadas. No desenvolvimento 
de novas áreas, a quantização da Mecânica lagrangiana de partículas ofereceu um modelo para a quantização de 
campos eletromagnéticos e levou à teoria de calibre da Eletrodinâmica Quântica. 

Uma das vantagens mais valiosas do princípio de Hamilton — formulação da equação de Lagrange — é a 
facilidade para ver a relação entre uma simetria e uma lei de conservação. Como exemplo, seja x; = p um 
ângulo azimutal. Se nossa lagrangiana for independente de (p (isto é, se y é uma coordenada que se pode ignorar), 
há duas consegiiências: (1) a conservação ou invariância de uma componente de momento angular e (2) pela 
Equação (17.52) OL/0p = constante. De modo semelhante, invariância sob translação leva à conservação de 
momento linear. O teorema de Noether é uma generalização dessa invariância (simetria) — a relação da lei da 
conservação. 


Exemplo 17.3.1 PARTÍCULA EM MOVIMENTO — COORDENADAS CARTESIANAS 
Considere a Equação (17.50), que descreve uma partícula com energia cinética 


T= img? (17.53) 
e energia potencial V(x), na qual, como sempre, a força é dada pelo gradiente negativo do potencial, 


dV (a) 


F(x) = — : (17.54) 
dx 
Pela Equação (17.52), 
do SMB c& z 
T (mi) DER F(x) =0, (17.55) 
que é a segunda lei do movimento de Newton. E 


Exemplo 17.3.2 PARTÍCULA EM MOVIMENTO — COORDENADAS CILÍNDRICAS CIRCULARES 
Agora vamos descrever uma partícula em movimento em coordenadas cilíndricas no plano xy, isto é, z = 0. A 
energia cinética é 
= Asia E D 2:22 
T = ġm(2? +92) = m(pº +P’), (17.56) 


e consideramos V = 0 por simplicidade. 

A transformação de t? + 12 em coordenadas cilíndricas circulares poderia ser efetuada considerando x(p, p) 
e y(p, p), Equação (2.28), e diferenciando em relação ao tempo e elevando ao quadrado. É muito mais fácil 
interpretar 2 + 3)? como v? e apenas escrever as componentes de v como (ds p/dt) = Pp, e assim por diante. 
(O ds, é um incremento de comprimento, sendo que p muda por dp, p permanece constante. Veja as Seções 2.1 
e 2.4.). 

As equações lagrangianas resultam em 


: . d ; 
— (mpb) — mp? = 0, geo) =0. (17.57) 


A segunda equação é um enunciado de conservação de momento angular. A primeira pode ser interpretada como 
aceleração radial? igualada à força centrífuga. Nesse sentido, a força centrífuga é uma força real. É interessante 
saber que essa interpretação da força centrífuga como uma força real é suportada pela teoria geral da relatividade. 


Exercícios 
17.3.1 (a) Desenvolva as equações de movimento correspondentes a L = m(t? +92). 


; « gs iba : t 
(b) Em que sentido suas soluções minimizam a integral di Ldt? 
Compare o resultado para a sua solução com x = constante, y = constante. 


9 Esse é um segundo método para atacar o Exercício 2.4.8. 
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17.3.2 


17.3.3 


17.3.4 


17.3.5 


17.3.6 


17.3.7 


Pelas equações lagrangianas de movimento, Equação (17.52), mostre que um sistema em equilíbrio 
estável tem uma energia potencial mínima. 

Escreva as equações lagrangianas de movimento de uma partícula em coordenadas esféricas para 
potencial V igual a uma constante. Identifique os termos correspondentes à (a) força centrífuga e 
(b) à força de Coriolis. 

O pêndulo esférico consiste em uma massa ligada a um fio de comprimento l, livre para se mover 
em ângulo polar 0 e ângulo de azimute y (Figura 17.9). 


Z 


Figura 17.9: Pêndulo esférico. 


(a) Estabeleça a lagrangiana para esse sistema físico. 
(b) Desenvolva as equações lagrangianas de movimento. 


Mostre que a lagrangiana 


leva a uma forma relativista da segunda lei de Newton do movimento, 


d ( moUi ) Sp 
d\ y1i-v/2) 
na qual as componentes da força são F; = —0V/dx;. 


A lagrangiana para uma partícula com carga q em um campo eletromagnético descrito por potencial 
escalar y e potencial vetorial A é 


L= {mv -qp+qA-v. 


Ache a equação de movimento da partícula carregada. 

Sugestão: (d/dt) A; = 0A; /ðt + X ;(3A;/Əx;)t;. A dependência dos campos de força E e B em 

relação aos potenciais y e A é desenvolvida na Seção 1.13 (compare com o Exercício 1.13.10). 
Resposta: mx; = q[E + v x Bi. 


Considere um sistema no qual a lagrangiana é dada por 
L(qi, da) = T (qi, di) — V (ai), 


em que q; e q; representam o conjunto de variáveis. A energia potencial V é independente da 
velocidade, e nem T' nem V têm qualquer dependência explícita do tempo. 
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(a) Mostre que 
(b) A quantidade constante 


define a hamiltoniana H. Mostre que, sob as condições admitidas precedentes, H = T + V, a 
energia total. 


Nota: A energia cinética T é uma função quadrática dos q;. 


17.4 Diversas Variáveis Independentes 


Às vezes, o integrando f da Equação (17.1) conterá uma função desconhecida, u, isto é, uma função de diversas 
variáveis independentes, u = u(x, y, z), para o caso tridimensional, por exemplo. A Equação (17.1) se torna 


J= Mi Flu, Ux, Uy, Uz, £, y, z] dz dy dz, (17.58) 


Ux = du/Ôx, e assim por diante. O problema variacional é achar a função u(x, y, z) para a qual J é estacionária, 


ôJ = dad? = =0. (17.59) 

Generalizando a Seção 17.1, fazemos 
u(x,y,2,0) = u(x,y,2,0) +an(x,y, 2), (17.60) 
em que u(x,y,z,œ = 0) representa a função (desconhecida) para a qual a Equação (17.59) é satisfeita, ao 


passo que, mais uma vez, n(x, y, z) é o desvio arbitrário que descreve a função variada u(x, y, 2, a). Esse desvio 
n(x, y, z) tem de ser diferenciável e desaparecer nas extremidades. Então, pela Equação (17.60), 


UML, Z, Q) = Uz(T, Y, Z, 0) + aNg, (17.61) 


e de modo semelhante para uy e uz. 
Diferenciando a equação integral, Equação (17.58) em relação ao parâmetro a em relação ao parâmetro a = 0, 
obtemos 


ðJ 
da 


= ðf of of of s 
e JJ (Su + Puga t gu, ™ t uz” dx dy dz = 0. (17.62) 


Novamente, integramos cada um dos termos (3 f /Ôu;)n; por partes. A parte integrada se anula nas extremidades 
(porque se exige que o desvio 7 caia para zero nas extremidades) e 


of of dof 03 
ii (5 dz om dy Em oz Em Jie, Mee dyap rua 
g y z 


Uma vez que a variação n(x, y, 2) é arbitrária, o termo dentro dos parênteses grandes é igualado a zero, o que 
resulta na equação de Euler para (três) variáveis independentes, 
of O Of o Of ð df 0 
dy Ovdur Odyduy Oz du, = 


(17.64) 


10Lembre-se de que 9/0x é uma derivada parcial na qual y e z são mantidos constantes. Mas O/dx também age sobre a dependência 
implícita x bem como sobre a dependência explícita x. Nesse sentido, por exemplo, 
o (əf 3f əf 3f af 3f 
da À dug Oxdus dudu ðu Ouyðuz Ou ua 


TZ. 
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Exemplo 17.4.1 Equação DE LAPLACE 
Um exemplo desse tipo de problema variacional é dado pela Eletrostática. A energia de um campo eletrostático é 


densidade de energia = 5€E?, (17.65) 
na qual E é o campo eletrostático de força usual. Em termos do potencial estático (o, 
densidade de energia = 5e(V p)?. (17.66) 


Agora vamos impor o requisito de que a energia eletrostática (associada com o campo) em um dado volume seja 
um mínimo. (Condições de contorno sobre E e y ainda devem ser satisfeitas.) Temos a integral de volume!! 


J= [JJ (nablaç)? de dydz = [JJ (43 + 92 + 42) dz dy az. (17.67) 


Com 


FCP, Pr Pys Pe 2Y, 2) = ps T Py ER (2, (17.68) 


a função y substituindo a função u da Equação (177.64), a equação de Euler dá como resultado 
UP rr + Pyy + Pre) — 0, (17.69) 
ou 
Vo(2,y,2) =0, (17.70) 


que é a equação de Laplace da Eletrostática. 
Uma investigação mais minuciosa mostra que esse valor estacionário é, de fato, um mínimo. Assim, o requisito 
de que a energia do campo seja minimizada leva à EDP de Laplace. E 


Exercícios 
17.4.1 O lagrangiano para uma corda vibratória (vibrações de pequena amplitude) é 


L= fim — iru?) dz, 


em que p é a densidade de massa linear (constante) e 7 é a tensão (constante). A integração em 
relação a x é sobre o comprimento da corda. Mostre que a aplicação do princípio de Hamilton 
à densidade lagrangiana (o integrando), agora com duas variáveis independentes, leva à clássica 
equação de onda 


u pôu 
ðr? r t2 
17.4.2 — Mostre que o valor estacionário da energia total do campo eletrostático do Exemplo 17.4.1 é um 


mínimo. 
Sugestão: Use a Equação (17.61) e investigue os termos a?. 


17.5 Diversas Variáveis Dependentes e Independentes 


Em alguns casos, nosso integrando f contém mais de uma variável dependente e mais de uma variável inde- 
pendente. Considere 


f = Apr) Pa, Py, Pz, (£, Y, Z), qx, Qy, qz; T(E, Y, Z); Tæ, Ty, T2, £, Y, à (17.71) 


Procedemos como antes com 


p(z, Y, Z, a) = p(z, 9,2; 0) qn aé(s, Y, z), 
q(x, yY, 2,0) = q(x,y, 2,0) 2g an(x,y, z), (17.72) 
r(x, y,z,&œ) = r(x, y,z,0) + a(z, y, 2), e assim por diante. 


HO índice inferior æ indica a derivada parcial de x e não uma componente de zx. 
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Tendo em mente que é,m e Ç são independentes uma da outra, como eram as m; na Seção 17.3, a mesma 
diferenciação, e então a integração por partes, leva a 
of O Of o Of o Of 
dp OdxôOpa OdyOpy 0z ðőpz 


0, (17.73) 


com equações similares para funções q e r. Substituindo p, q,7,... pOr Yi e x,%),z,... por Ty, podemos colocar a 
Equação (17.73) em uma forma mais compacta: 


of o ( of ) . 
=0, t= ary (17.73a) 
yi > dx; Oy; 
na qual 
— Oy; 
Yij Z Ox; 


Uma aplicação da Equação (177.73) aparece na Seção 17.7. 


Relação com a Física 

O cálculo de variações do modo como foi desenvolvido até aqui dá uma descrição elegante de uma ampla variedade 
de fenômenos físicos. Entre esses citamos os da Mecânica Clássica na Seção 17.3; Mecânica Relativista, Exercício 
17.3.5; Eletrostática, Exemplo 17.4.1, e Teoria Eletromagnética, Exercício 17.5.1. A conveniência não deve ser 
minimizada, mas, ao mesmo tempo, devemos estar cientes de que, nesses casos, o cálculo de variações apenas 
forneceu uma descrição alternativa do que já era conhecido. Mas a situação muda com teorias incompletas. 

e Sea Física básica ainda não for conhecida, um princípio variacional postulado pode ser um útil ponto de partida. 


Exercício 
17.5.1 O lagrangiano (por unidade de volume) de um campo eletromagnético com uma carga de densidade p é 


dado por 
1 


1 
B= (com? B?) po +pv-A. 
Ho 


Mostre que as equações de Lagrange levam a duas equações de Maxwell. (As duas restantes são conseqüência 
da definição de E e B em termos de A e y.) Essa densidade de Lagrange vem de uma expressão escalar na Seção 
4.6. 

Sugestão: Considere Ay, Ao, Ag e y variáveis dependentes, x,y,z e t variáveis independentes. E e B são 
dados em termos de A e y pelas Equações (4.142) e (1.88). 


17.6 Multiplicadores de Lagrange 


Nesta seção introduzimos o conceito de restrição. Para simplificar o tratamento, a restrição aparece como uma 
função simples, em vez de uma integral. Nesta seção não estamos preocupados com o cálculo de variações, 
mas na Seção 17.7 as restrições, juntamente com nossos recém-desenvolvidos multiplicadores de Lagrange, são 
incorporados ao cálculo de variações. 

Considere uma função de três variáveis independentes, f(x,y,z). Para a função f ser um máximo (ou 
extremo), !2 


df = 0. (17.74) 
A condição necessária e suficiente para isso é 
OF Of Of 
7r a 0, (17.75) 
na qual 
_ 3f of of 
df = art" + yar 3z dz. (17.76) 


Em problemas de Física, muitas vezes as variáveis x, y, z estão sujeitas a restrições de modo que não são mais 
todas independentes. E possível, ao menos em princípio, usar cada restrição para eliminar uma variável e prosseguir 
com um novo conjunto menor de variáveis independentes. 


2Incluindo um ponto de sela. 
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A utilização de multiplicadores de lagrange é uma técnica alternativa que pode ser aplicada quando essa 
eliminação de variáveis é inconveniente ou indesejável. Seja nossa equação de restrição 


plx, y,z) =0, (17.17) 


` 


da qual z(x,y) pode ser extraída se x,y forem tomadas como as coordenadas independentes. Voltando à 
Equação (17.74), não mais resulta a Equação (17.75) porque agora há somente duas variáveis independentes, 
portanto dz não é mais arbitrária. Pela diferencial total dy = 0, obtemos então 


ðp «OA dp 
To DE é Oy 


dy (17.78) 


e, por conseguinte, 


ə ð Ə ə ? 
df = dedo + Edy +a(Sêdo+ Sa 2); yz E, 


admitindo y, = se + 0. Assim, podemos somar a Equação (17.76) e um múltiplo da Equação (17.78) para obter 


of of of 
df + Ady = À d — +à d — +à dz = 0. 17.79 
f + Ady (5 + age) dos (aE) du (ade z ( ) 
Em outras palavras, nosso multiplicador Lagrange À é escolhido de modo que 
of 
=0 17.80 
Əz Ta z l ( ) 
admitindo que 9/02 0. Agora, a Equação (17.79) se torna 
91,49 of 
= +A da AS = 0. 17.81 
(5 + se) (Ha Oy dy ( ) 
Contudo, agora da e dy são arbitrárias e as quantidades entre parênteses devem se anular: 
of of dy 
=] "+A>— =0. 17.82 
dx di x í Oy E Oy ( ) 


Quando as Equações (17.80) e (17.82) são satisfeitas, df = 0 e f é um extremo. Note que agora há quatro 
incógnitas: x,y,z e À. A quarta equação, é claro, é a equação de restrição, Equação (17.77). Queremos somente 
x, y e z, portanto À não precisa ser determinado. Por essa razão, À às vezes é denominado multiplicador 
indeterminado de Lagrange. Esse método falhará se todos os coeficientes de À desaparecerem no extremo, 
dp/0x, Op /Oy, Op/0z = 0. Então é impossível resolver para À. 

Note que, pela forma das Equações (17.80) e (17.82), poderíamos identificar f como a função que assume um 
valor extremo sujeito a y, a restrição, ou poderíamos identificar a restrição e f como a função g. 

Se tivermos um conjunto de restrições y,, então as Equações (17.80) e (17.82) se tornam 


com um multiplicador de Lagrange separado Ay para cada px. 


Exemplo 17.6.1 PARTÍCULA DENTRO DE UMA CAIXA 

Como exemplo da utilização de multiplicadores de Lagrange, considere o problema da Mecânica Quântica de uma 
partícula (massa m) dentro de uma caixa. A caixa é um paralelepípedo retangular com lados a, b e c. A energia do 
estado fundamental da partícula é dada por 


de 1 1 
E = RA ME s 17.83 

mia? P æ ( ) 
Procuramos o formato da caixa que minimizará a energia E, sujeito à restrição de que o volume seja constante, 


V(a,b,c) = abc = k. (17.84) 
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Com f(a,b,c) = E(a, b,c) e y(a, b,c) = abc — k = 0, obtemos 


oE dy h? 
da + Ada = ga + Abe =0. (17.85) 


Além disso, 
2 2 


h 
E Aac= 0 —— + Aab = 0. 
4mb? FAE i Ame? Taaa 


Multiplicando a primeira dessas expressões por a, a segunda por b e a terceira por c, temos 


h? h? h? 
Aabc = = = j 17.86 
Pe qma? 4mb? Ame ( ) 
Por conseguinte, nossa solução é 
a=b=c, um cubo. (17.87) 
Note que À não foi determinado, mas resulta da Equação (17.86). E 


Exemplo 17.6.2 REATOR NUCLEAR CILÍNDRICO 


Um outro exemplo é dado pela teoria do reator nuclear. Suponha que um reator nuclear (térmico) deva o ter a forma 
de um cilindro circular de raio R e altura H. A teoria da difusão de nêutrons fornece uma restrição: 


2,4048 \ ° 2 
(R, H) = ( 5x `) + (5) = constante.! (17.88) 
Queremos minimizar o volume do vaso do reator, 
F(R, H) = 7RêH. (17.89) 
Aplicando a Equação (17.82), temos 
of dy (2, 4048)? 
— > = 2r RH — 2) = 
JR + AJR TR À E 0, 
of dy 2 nº 
EAS Es —2\— = 0. 17. 
2H `DH TR TE 0 (17.90) 


Multiplicando a primeira dessas equações por R/2 e a segunda por H, obtemos 


2 2 
«RH — 4048)? | 2m 


Pê H2’ (17.91) 
ou altura sp 
27R 
H = = 1,84 17.92 
2, 4048 h (iraa 


para o reator cilíndrico circular reto de volume mínimo. 
Em termos estritos, achamos apenas um extremo. Sua identificação como um mínimo resulta de uma 
consideração das equações originais. E 


Exercícios 
Os problemas seguintes devem ser resolvidos usando multiplicadores de Lagrange. 


17.6.1 A energia de estado fundamental de uma partícula quântica de massa m dentro de uma pastilha 
(cilindro circular reto) é dada por 


h2 ((2,4048)2 7? 
E (+ m). 


“9m R? H? 


na qual R é o raio e H a altura da caixa. Ache a razão entre R e H que minimizará a energia para 
um volume fixo. 


132,4048 . . . é a raiz mais baixa da função de Bessel Jo (R) (compare com a Seção 11.1). 


ELSEVIER 
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17.6.2 


17.6.3 


17.6.4 


17.6.5 


17.6.6 


17.6.7 


17.6.8 


17.6.9 


Ache a razão entre R (raio) e H (altura) que minimizará a área da superfície total de um cilindro 
circular reto de volume fixo. 


O Correio dos Estados Unidos limita a remessa de encomendas de primeira classe para o Canadá 
a 90 centímetros de comprimento, mais a circunferência. Usando um multiplicador de Lagrange, 
ache o volume máximo e as dimensões de uma embalagem (paralelepípedo retangular) sujeita a 
essa restrição. 


Um reator nuclear térmico está sujeito à restrição 


IN? MNE nm? 5 
p(a,bco)=|[—]|] + 7 + [— ) = Bº, uma constante. 
a c 


Ache as razões entre os lados de um reator na forma de um paralelepípedo regular de volume 
mínimo. 
Resposta: a = b = c, cubo. 


Para uma lente de comprimento focal f, a distância do objeto p e a distância da imagem q estão 
relacionadas por 1/p + 1/q = 1/f. Ache a mínima distância objeto-imagem (p + q) para f fixo. 
Admita objeto e imagem reais (p e q positivas). 

Dada uma elipse (x/a)? + (y/b)? = 1, ache o retângulo inscrito de área máxima. Mostre que a 
razão entre a área do retângulo de área máxima e a área da elipse é 2/7 = 0, 6366. 


Um paralelepípedo retangular está inscrito em um elipsóide com semi-eixos a,b e c. Maximize 
o volume do paralelepípedo retangular inscrito. Mostre que a razão entre o máximo volume e o 
volume do elipsóide é 2/73 = 0,367. 


Uma esfera deformada tem um raio dado por r = rotao + azPo(cos0)), em que ao = 1e 
|a2| < |ao]. Pelo Exercício 12.5.16, a área e o volume são 


4/05 Nº 4rrè 3f aN’ 
A=4mradi+ =| = O qa 2] h. 
mrga (2 , V 3 ao tg ao 


Termos de ordem aj foram desprezados. 


(a) Considerando a restrição de que o volume encerrado seja mantido constante, isto é, V = 
4nrê /3, mostre que a superfície limitadora de área mínima é uma esfera (ao = 1, as = 0). 

(b) Considerando a restrição de que a área da superfície limitadora seja mantida constante, isto é, 
A = 4rrê, mostre que o volume encerrado é um máximo quando a superfície é uma esfera. 


Ache o máximo valor da derivada direcional de y(x, y, z), 
dy 


cos 8 + — cos y, 
Oz 


do dp dy 
= ar PIE g 


sujeita à limitação 
cos? a + cos? 8 + cos? q = 1. 
d 
Resposta: (%2) = |Vyl]. 
ds 


Observações sobre os exercícios seguintes: em um sistema quântico há g; estados quânticos distintos 
entre energias E; e E; + dE;. O problema é descrever como n; partículas estão distribuídas entre 
esses estados sujeitas a duas restrições: 


(a) número fixo de partículas. 
5 Nn SEN. 
i 


(b) energia total fixa, 
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17.6.10 Para partículas idênticas que obedecem ao princípio de exclusão de Pauli, a probabilidade de um 
dado arranjo é 


f 
Wrp = No a 


Mostre que maximizar WF p, sujeito a um número fixo de partículas e energia total fixa, leva a 


es Ji 
M= eàità2Ei 41` 
Com À = —Eo/kT e À» = 1/kT, isso resulta na estatística de Fermi-Dirac. 


Sugestão: Tente trabalhar com ln W e usar a fórmula de Stirling, Seção 8.3. A justificativa para a 
diferenciação em relação a n; é que, aqui, estamos tratando com um grande número de partículas, 

17.6.11 Para partículas idênticas mas sem nenhuma restrição ao número em um dado estado, a probabilidade 
de um determinado arranjo é 


Mostre que maximizar Wg g, sujeito a um número fixo de partículas e energia total fixa, leva a 


E g H 


Nj = =o 
fa eàità2Ei 1 
Com À = —Eo/kT e À» = 1/kT, isso resulta na estatística de Bose-Einstein. 


Nota: Admita que g; > 1. 


17.6.12 Fótons satisfazem Wg p e a restrição da energia total constante mas, claramente, não satisfazem a 
restrição do número fixo. Mostre que eliminar a restrição do número fixo leva ao resultado anterior, 
porém com A; = 0. 


17.7 Variação com Vínculos 


Como nas seções precedentes, buscamos o caminho que fará a integral 


Oyi 
J= [iho SE a) dx; (17.93) 


estacionária. Esse é o caso geral em que x; representa um conjunto de variáveis independentes, e y;, um conjunto 
de variáveis dependentes. Novamente, 
ôJ = 0. (17.94) 


Contudo, agora introduzimos um ou mais vínculos, o que significa que as y; não são mais independentes umas das 
outras. Nem todas as n; podem ser variadas arbitrariamente, e as Equações (177.62) e (17.734) não se aplicariam. O 
vínculo pode ter a forma 

PklYi, £j) = 0, (17.95) 


como na Seção 17.6. Nesse caso podemos multiplicar por uma função de xj, por exemplo, Ax (x;), e integrar sobre 
a mesma faixa da Equação (17.93) para obter 


Presos as) de=): (17.96) 
Então, claramente, 

6 Palas)on(u.2) da; =0. (17.97) 
Como alternativa, a restrição pode aparecer na forma de uma integral 


festas Owi/0a sa) da; = constante. (17.98) 


Podemos introduzir qualquer multiplicador de Lagrange constante e, mais uma vez, resultaria a Equação (17.97) 
— agora com À constante. 
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Em qualquer dos casos, somando as Equações (17.94) e (17.97), possivelmente com mais de um vínculo, 


obtemos A 
Yi 
o ff (v dx! 2) + 2 a (ts) dx; = 0. (17.99) 
O multiplicador de Lagrange A; pode depender de x; quando y(y;, xj) é dado na forma da Equação (17.95). 
Tratando todo o integrando como uma nova função, 


Oyi 
isa o Lj] 


obtemos 3 
Yi = 
Se tivermos N y; (i = 1,2,...,N) em vínculos (k = 1,2,...m), então N — m das m, podem ser consideradas 


arbitrárias. Para as restantes m n;, À pode, em princípio, ser escolhido de modo a satisfazer as equações de Euler- 
Lagrange remanescentes, em total analogia com a Equação (17.80). O resultado é que nossa função composta em 
g deve satisfazer as equações de Euler-Lagrange usuais, 


3g o og 
=0, (17.101) 
Oyi > Ox; (Oyi;/0x;) 


com uma equação como essa para cada variável dependente y; (compare com as Equações (17.64) e (17.73)). 
Então, essas equações de Euler e as equações de vínculos são resolvidas simultaneamente para achar a função que 
apresenta um valor estacionário. 


Funções Lagrangianas 


Na ausência de vínculos, verificamos que as equações de Lagrange do movimento (Equação (17.52)) são!* 


dor ƏL 
dt ðġi ðq 


sendo t (tempo) a única variável independente e q; (t) (posições de partícula) um conjunto de variáveis dependentes. 
Usualmente as coordenadas generalizadas q; são escolhidas para eliminar as forças de vínculo, mas isso não é 
necessário e nem sempre desejável. Na presença de restrições (holonômicas), Y, = 0, o princípio de Hamilton é 


5 fianai PR MOa) dt =0, (17.102) 
k 


e as equações de movimento lagrangianas restritas são 


doL OL 
AT a = amd: (17.103) 
dt ği aqi E 


Usualmente, py = y(qi,t), independente das velocidades generalizadas q;. Nesse caso, o coeficiente a; é dado 
por 
dp 
Qik = j 
A Oqi 
Então, aikàķg (sem somatório) representa a força do k-ésimo vínculo na direção q; que aparece na 
Equação (17.103), exatamente do mesmo modo que —9V/dg;. 


(17.104) 


Exemplo 17.7.1  PĉnpuLo simpLes 
Para ilustrar, considere o pêndulo simples uma massa m restringida por um fio de comprimento 1 a oscilar em um 
arco (Figura 17.10). Na ausência do único vínculo. 


Pı frm (e l = 0 (17.105) 


140 símbolo q é costumeiro na Mecânica Clássica. Serve para enfatizar que a variável não é necessariamente uma variável cartesiana (e não 
necessariamente um comprimento). 
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Z 


Figura 17.10: Pêndulo simples. 


há duas coordenadas generalizadas r e 0 (movimento no plano vertical). O lagrangiano é 


L=T-V= Im(i2 + 129) + mgr cos9, (17.106) 


considerando potencial V como zero quando o pêndulo é horizontal, 0 = 7/2. Pela Equação (17.103), as equações 
de movimento são 


dôoL OL dôoL OL 
tor dr Ab do 0070 (am =1, ag1 = 0), (17.107) 


ou 


T (mr) mr” mgcos0 = A, 


d ; 
J (mr20) + mgrsen 0 = 0. (17.108) 


Substituindo na equação de restrição (r = 1,7 = 0), temos 
mlġ? +mgcos=-M, mÊ + mglsen 0 = 0. (17.109) 


A segunda equação pode ser resolvida para 0 (t) para resultar em movimento harmônico simples se a amplitude for 
pequena (sen 6 ~ 0), ao passo que a primeira equação expressa a tensão no fio em termos de 0 e 0. 

Note que, uma vez que a equação de restrição, Equação (17.105), está na forma da Equação (17.95), o 
multiplicador de Lagrange À pode ser (e aqui é) uma função de t (ou de 0). 


Exemplo 17.7.2 DESPRENDENDO-SE DA SUPERFÍCIE DE UM TRONCO 


Um problema que guarda uma relação muito próxima com esse é o de uma partícula que está deslizando sobre uma 
superfície cilíndrica. O objetivo é achar o ângulo crítico 9. no qual a partícula é lançada para fora da superfície. 
Esse ângulo crítico é o ângulo no qual a força de vínculo radial cai a zero (Figura 17.11). Temos 


L=T-V= bm(i? + 120”) — mgrcos0 (17.110) 


e a única equação de vínculo 
py=r-1=0. (17.111) 


Continuando como no Exemplo 17.7.1 com ayı = 1, 


mê — mrô” + mg cos0 = M(0), 
mr20 + 2mriô — mgrsen 0 = 0, (17.112) 
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Figura 17.11: Uma partícula deslizando sobre uma superfície cilíndrica. 
na qual a força de restrição A (0) é uma função do ângulo 0.!º Uma vez que r = 1,7 = + = 0, a Equação (17.112) 
se reduz a 


mig” + mgcos6 = M (9), (17.113a) 
ml? — mglsen 6 = 0. (17.113b) 


Diferenciando a Equação (177.113a) em relação ao tempo e lembrando que 


aro) _ af(o) 


11 = 209 17.114 
dt do ( ) 
obtemos ato 
—2mlô — mgsen 6 = 10) (17.115) 
Usando a Equação (17.113b) para eliminar o termo Ô e então integrando, temos 
A(O) = Img cos0 + C. (17.116) 
Uma vez que 
A(O) = mg, (17.117) 
C = —2mg. (17.118) 


2 


A partícula m permanecerá na superfície enquanto a força de restrição for não-negativa, isto é, enquanto a 
superfície tiver de exercer um impulso para fora sobre a partícula: 


A(0) = 3mg cos 0 — 2mg > 0. (17.119) 
O ângulo crítico se encontra em À1(9..) = 0, a força de vínculo cai a zero. Pela Equação (17.119), 


cos. =2 ou G=48]/', (17.120) 


em relação à vertical. Nesse ângulo (desprezando todo o atrito) nossa partícula é lançada para fora da superfície. 
Temos de reconhecer que esse resultado pode ser obtido com mais facilidade considerando uma força centrípeta 

variável fornecida pela componente radial da força gravitacional. O exemplo foi escolhido para ilustrar a utilização 

do multiplicador indeterminado de Lagrange sem confundir o leitor com um sistema físico complicado. E 


Exemplo 17.7.3 A Equação DE ONDA DE SCHRÖDINGER 


Como ilustração final de um mínimo restringido, vamos achar as equações de Euler para um problema da Mecânica 
Quântica 


a fff yp*(x,y,z)HŅ(z,y,z)dx dy dz = 0, (17.121) 


Note que Àı é a força radial exercida pelo cilindro sobre a partícula. Considerando o problema físico, vemos que A deve depender do 
ângulo 8. Antes permitimos que À = A(t). Agora, estamos substituindo a dependência de tempo por uma dependência angular (desconhecida) 
usando 0 = 8 (t). 
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com a restrição de normalização 
i way dz dy dz = 1. (17.122) 


A Equação (17.121) é uma afirmação de que a energia do sistema é estacionária, sendo H a hamiltoniana da 
Mecânica Quântica para uma partícula de massa m um operador diferencial, 


h2 
H = -— V?’ + V(x,y, z). (17.123) 
2m 


A Equação (17.122) é uma restrição de estado limitado, é a função de onda usual, uma variável dependente, e 
1y*, seu complexo conjugado, é tratado como uma segunda!“ variável dependente. 

O integrando na Equação (17.121) envolve derivadas de segunda ordem que podem ser convertidas a derivadas 
de primeira ordem integrando por partes: 


2 * 
Je dz = yp“ a Pu a dz (17.124) 
0x2 


ox dx dr 


Ou admitimos condições de contorno periódicas (como na teoria de Sturm-Liouville, Capítulo 10) ou que o volume 
de integração é tão grande que 1 e q” se anulam com suficiente rapidez!” no contorno. Então a parte integrada 
desaparece e a Equação (17.121) pode ser reescrita como 


2 
a fff ive -VY+ vey dz dydz = 0. (17.125) 
A função g da equação (17.100) é 
h2 
g= A -Vy + Vi — by 
2 


novamente usando o índice inferior x para denotar O/ôx. Para y; = Y“, a Equação (17.101) se torna 


3g ð Og o dg ð dg Li 
dy" dry, dydb, Ozdy; ns 


Isso resulta em P 
h 

ou 

h2 

-> Vy + VY = NM. (17.127) 

2m 
Referência à Equação (17.123) nos habilita a identificar A em termos físicos como a energia do sistema da quântico. 
Com essa interpretação, a Equação (17.127) é a celebrada equação de onda de Schrödinger. E 


Essa abordagem variacional é mais do que apenas uma questão de curiosidade acadêmica. Ela nos dá um método 
muito poderoso de obter soluções aproximadas da equação de onda (método variacional de Rayleigh-Ritz, Seção 
17.8). 


Exercícios 
17.7.1 Uma partícula massa m está sobre uma superfície horizontal sem atrito. Ela está restrita a se mover, 
de modo que 0 = wt (braço giratório radial, nenhum atrito). Com as condições iniciais 


t=0, r = To, t= 0, 


(a) Ache as posições radiais como uma função do tempo. 
Resposta: r(t) = ro cosh wt. 


(b) Ache a força exercida sobre a partícula pela restrição. 


16Compare com a Seção 6.1. 
“Por exemplo, limr—oo ry(r) = 0. 


ELSEVIER 
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17.7.2 


17.7.3 


17.7.4 


17.7.5 


17.7.6 


17.7.7 


Resposta: F() = 2mřw = 2mrow?senh wt. 

Uma massa pontual m está se movendo sobre um plano achatado, horizontal, sem atrito. A massa 

está restrita por uma corda a se movimentar para dentro na direção radial a uma taxa constante. 

Usando coordenadas polares planas (p, 9), p = po — kt, 

(a) Estabeleça o lagrangiano. 

(b) Obtenha as equações com vínculos de Lagrange. 

(c) Resolva a equação de Lagrange dependente de y para obter w(t), a velocidade angular. Qual é 
o significado físico da constante de integração que você obtém de sua integração “livre”? 

(d) Usando a w(t) da parte (b), resolva a equação de Lagrange (com vínculo) dependente de p 
para obter A(t). Em outras palavras, explique o que está acontecendo com a força de vínculo à 
medida que p — 0. 

Um cabo flexível está suspenso de dois pontos fixos. O comprimento do cabo é fixo. Ache a curva 

que minimizará a energia potencial gravitacional total do cabo. 


Resposta: Co-seno hiperbólico. 


Um volume de água fixo está girando dentro de um cilindro com velocidade angular constante w. 
Ache a curva da superfície da água que minimizará a energia potencial total da água no campo de 
força combinado centrífugo-gravitacional. 


Resposta: Parábola. 


(a) Mostre que, para um perímetro de comprimento fixo, a figura com área máxima é um círculo. 
(b) Mostre que, para uma área fixa, a curva com perímetro mínimo é um círculo. 


Sugestão: O raio de curvatura R é dado por 
(1? ni) 
Trog — 273 — 12º 


Nota: Os problemas desta seção, com variação sujeita a vínculos, costumam ser denominados 
isoperimétricos. O termo surgiu de problemas de maximização de área sujeita a um perímetro fixo, 
como no Exercício 17.7.5(a). 


Mostre que exigir que J, dada por 


b 
Ja f [plæ)y? — q(@)y’] de, 


tenha um valor estacionário sujeito à condição de normalização 


b 
/ yêw(x) dr = 1 


leva à equação de Sturm-Liouville do Capítulo 10: 


d dy 
— | p—+ Awy = 0. 
(E) tas wy =0 


Nota: A condição de fronteira 
b 
= 0 


a 


é usada na Seção 10.1 para estabelecer a propriedade hermitiana do operador. 


PYay 


Mostre que exigir que J, dada por 
b pb 
J= | | Kæ oleji) dedi, 
tenha um valor estacionário sujeito à condição de normalização 
b 
/ (x) de = 1 


leva à equação integral de Hilbert-Schmidt, Equação (16.89). 
Nota: O núcleo K(x,t) é simétrico. 
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17.8 Técnica Variacional de Rayleigh-Ritz 
O Exercício 17.7.6 revela uma relação entre o cálculo de variações e problemas de autovalores de autofunção. 
Podemos reescrever a expressão do Exercício 17.7.6 como 


Ji (pu? — qu?) da 
f? y? w da 


Fly(x)] = (17.128) 
na qual a restrição aparece no denominador como uma condição normalizadora. Após encontrar o mínimo não- 
restrito de F, pode ser normalizada sem alterar o valor estacionário de y porque valores estacionários de F 
correspondem a valores estacionários de J. Então, pelo Exercício 17.7.6, quando y(x) é tal que J e F assumem 
um valor estacionário, a função ótima y(x) satisfaz a equação de Sturm-Liouville 


d/d 

(pl +qy+Avy=o, (17.129) 
da NV dz 

sendo À o autovalor (não um multiplicador de Lagrange). Integrando o primeiro termo no numerador da 
Equação (17.128) por partes e usando a condição de contorno, 


b 


PYsy| =0, (17.130) 


a 


Fly(x)| = / vã (15) + au a/f Pu da. (17.131) 


Então, substituindo na Equação (17.129), os valores estacionários de F'[y(x)] são dados por 


Fly(x)] = àn, (17.132) 


obtemos 


sendo A, o autovalor correspondente à autofunção yn. A Equação (17.132) com F dada pela Equação (17.128) ou 
Equação (177.131) forma a base do método de Rayleigh-Ritz para o cálculo de autofunções e autovalores. 


Autofunção de Estado Fundamental 

Suponha que queremos calcular a autofunção de estado fundamental y e o autovalor! Ag de algum sistema 
atômico ou nuclear complicado. O exemplo clássico, para o qual não existe nenhuma solução exata, é o problema 
do átomo de hélio. A autofunção yo é desconhecida, mas admitiremos que podemos dar um palpite muito bom 
quanto a uma função aproximada y, portanto, matematicamente podemos escrever!” 


y =y +) cy. (17.133) 
1=1 


Os c; são quantidades pequenas. (Sua grandeza depende da qualidade de nosso palpite.) As y; são autofunções 
ortonormalizadas (também desconhecidas) e, portanto, nossa função experimental y não é normalizada. 
Substituindo a função aproximada y na Equação (17.131), e observando que 


b 
| ul (%) + an} da = —AÀiðij, (17.134) 
Fly(x)] = aia, (17.135) 


Aqui, consideramos que as autofunções são ortonormais — uma vez que são soluções da equação de Sturm- 
Liouville, Equação (17.129). Também admitimos que yo é não-degradada. Agora, se substituirmos }-; CiÃ — 
>; ào + >; e (Ai — ào), obtemos 


Dici GA — ào) 
1+ Jasi Ci 


Fly(x)| = ào + (17.136) 


A Equação (17.136) contém dois resultados importantes. 


!8Tsso significa que ào é o autovalor mais baixo. A Equação (17.128) deixa claro que, se p(x) > 0 e q(x) < O (compare com a Tabela 
10.1), então F[y(x)] tem um limite inferior e esse limite inferior é não-negativo. Lembre-se da Seção 10.1 que w(x) > 0. 
Estamos adivinhando a forma da função. A normalização é irrelevante. 
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e Enquanto o erro na autofunção y foi O(c;), o erro em À é apenas O(c?). Mesmo uma aproximação ruim das 
autofunções pode dar como resultado um cálculo preciso do autovalor. 
e Se Ao for o autovalor mais baixo (estado fundamental), então, uma vez que À; — ào > 0, 


Fly(x)] = A > ào, (17.137) 


ou nossa aproximação é sempre a maior e fica cada vez mais baixa, convergindo para Ao, à medida que nossa 
autofunção aproximada y melhora (c; — 0). Note que a Equação (17.137) é uma consegiiência direta da 
Equação (17.135). Mais diretamente, F'[y(x)] na Equação (17.135) é uma média ponderada positivamente dos À; 
e, portanto, não deve ser menor do que o menor A;, ou seja, Ao. Em problemas práticos de Mecânica Quântica, y 
muitas vezes depende de parâmetros que podem ser variados para minimizar F e, por isso, melhorar a estimativa 
da energia Ag do estado fundamental. Esse é o “método variacional” discutido em textos de Mecânica Quântica. 


Exemplo 17.8.1 CORDA VIBRATÓRIA 
Uma corda vibratória, presa em x = 0 e 1, satisfaz a equação de autovalor 


dy 

—S+Ay=0 17.138 

a TY ( ) 
e a condição de contorno y(0) = y(1) = 0. Para esse exemplo simples, reconhecemos imediatamente que 


yo(x) = sen mx (não-normalizada) e Ao = 72. Mas vamos experimentar a técnica de Rayleigh-Ritz. 
Sem esquecer as condições de contorno, experimentamos 


ylz) = a(1 — z). (17.139) 
Então, com p = 1 e w = 1, a Equação (17.128) resulta em 


P hO- 2r) de 1/3 o 


T z?(1 — x)? dx = 1/30 0 


Fly(x)] 10. (17.140) 


Esse resultado, A = 10, é uma aproximação bastante boa (erro de 1,3%) 2 de Ao = 7º = 9. 8696. Você talvez 
tenha notado que y(x), Equação (17.139), não é normalizada para unidade. O denominador em F[y(x)| compensa 
a falta de normalização para unidade. F também pode ser calculada a partir da Equação (17.131), visto que a 
Equação (17.130) é satisfeita por y da Equação (17.139). 
No cálculo científico usual a autofunção seria melhorada introduzindo mais termos e parâmetros ajustáveis, tais 
como 
y = z(1 — z) + az’ (1 — z)’. (17.141) 


É conveniente, mas não necessário, que os termos adicionais sejam ortogonais. O parâmetro az é ajustado para 
minimizar F[y(x)]. Nesse caso, escolher a, = 1,1353 leva F[y(x)] para baixo até 9,8697, muito próximo do 
valor correto do autovalor. E 


Exercícios 


17.8.1 Pela Equação (17.128), desenvolva detalhadamente o argumento quando À > 0 ou À < 0. Explique 
as circunstâncias sob as quais À = 0, e ilustre com vários exemplos. 


17.8.2 Uma função desconhecida satisfaz a equação diferencial 


2 
m T 

A =0 
TIOE 


e as condições de contorno 


20A proximidade do ajuste pode ser verificada por uma expansão de Fourier de seno (compare com o Exercício 14.2.3 no meio intervalo 
[0, 1] ou, o que é equivalente, no intervalo [—1, 1], considerando y(x). Por causa da simetria par relativa a x = 1/2, somente aparecem termos 
n ímpares: 
sen 3ng sen 5ng 


væ =a(t=a) = (5) [sena + Ce, 
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(a) Calcule a aproximação 
à= F[Yexperimental] 
para 
e 2 
Yexperimental =1- z’. 
(b) Compare com o autovalor exato. 
Resposta: (a) A = 2,5, (b) A/Aexato = 1, 013. 
17.8.3 No Exercício 17.8.2 use uma função experimental 
y=1-a”. 
(a) Ache o valor de n que minimizará F [yexperimental)- 
(b) Mostre que o valor ótimo de n leva a razão A/Aexato para baixo, até 1,003. 
Resposta: (a) n = 1,7247. 
17.8.4 Uma partícula da mecânica quântica dentro de uma esfera (Exemplo 11.7.1) satisfaz 
Vêp+kp=o, 
com k? = 2mE /h2. A condição de contorno é que y(r = a) = 0, em que a é o raio da esfera. Para 
o estado fundamental [em que 1) = «(r)], experimente um função de onda aproximada 
PN? 
= 1 — — 
w =1- (5) 
e calcule um autovalor aproximado k2. 
Sugestão: Para determinar p(r) e w(r), coloque sua equação em forma auto-adjunta (em 
coordenadas polares esféricas). 
10,5 2 
Resposta: k? = F , kene T 
17.8.5 A equação de onda para o oscilador da Mecânica Quântica pode ser escrita como 
dab(x) 2 
dr +(A-2)y(r)=0, 
com À = 1 para o estado fundamental (Equação (13.18)). Considere 
2 
aa 1— Zz,» ia Š a? 
Vezperimentái = 0, q2 > a2 
para a função de onda do estado fundamental (sendo a? um parâmetro ajustável) e calcule a energia 
de estado fundamental correspondente. De quanto é seu erro? 
Nota: Na verdade, sua parábola não é uma aproximação muito boa para uma exponencial gaussiana. 
Que melhorias você pode sugerir? 
17.8.6 A equação de Schrödinger para um potencial central pode ser escrita como 
pi(l+1 
Luto) + e Dur) = Eulr): 
O termo (l+ 1), a barreira do momento angular, vem da subdivisão da dependência angular (Seção 
9.3). Tratando esse termo como uma perturbação, use sua técnica variacional para mostrar que 
E > E, em que Eo é o autovalor de energia de Luo = Eouo correspondente para | = 0. Isso 
significa que o estado de energia mínima terá | = 0, momento angular zero. 
Sugestão: Você pode expandir u(r) como uo(r) + > 4 c;u;, em que Lu; = Eju;, E; > Eo. 
17.8.7 — Na de autovetor matricial a equação de autovalor, 


Ar; = Ati, 
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onde À é uma matriz hermitiana n x n. Por simplicidade, admita que seus n autovalores reais (Seção 
3.5) são distintos, sendo A, o maior. Se r for uma aproximação de r1, 


n 
r=r,+ > ôi ri, 
i=2 


mostre que 
rİAr 


< ài 


e que o erro em À; é da ordem |ĝ;|?. Considere |ô;| < 1. 
Sugestão: As n r; formam um conjunto ortogonal completo que abrange o espaço n dimensional 
(complexo). 


17.8.8 A solução variacional do Exemplo 17.8.1 pode ser refinada considerando y = x(1 — x) + agx2(1 — 
x)”. Usando a quadratura numérica, calcule Aprox = F[y(x)], Equação (17.128), para um valor 
fixo de a2. Varie a2 para minimizar À. Calcule o valor de ao que minimiza À e calcule o próprio À, 


ambos com cinco algarismos significativos. Compare seu autovalor À com 72. 


Leituras Adicionais 
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de problemas como os de área mínima. 
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Sagan, H., Boundary and Eigenvalue Problems in Mathematical Physics. Nova York: Wiley (1961), nova tiragem, 
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Liouville, funções de Legendre e Bessel e série de Fourier. O Capítulo 1 é uma introdução ao cálculo de 
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(1983). Uma excelente introdução à moderna teoria do cálculo de variações, mais sofisticada e completa do que 
seu texto de 1961. Sagan abrange condições de suficiência e relaciona o cálculo de variações a problemas da 
tecnologia espacial. 

Weinstock, R., Calculus of Variations. Nova York: McGraw-Hill (1952); Nova York: Dover (1974). Um 
desenvolvimento sistemático e detalhado do cálculo de variações e aplicações à teoria de Sturm-Liouville e 
a problemas físicos de Elasticidade, Eletrostática e Mecânica Quântica. 

Yourgrau, W., e S. Mandelstam, Variational Principles in Dynamics and Quantum Theory, 3 ed. Filadélfia: 
Saunders (1968): Nova York: Dover (1979). Um tratamento abrangente e autorizado de princípios variacionais. 
As discussões sobre o desenvolvimento histórico e as armadilhas metafísicas são de particular interesse. 
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Métodos Não-Lineares e Caos 


Nossa mente se perderia na complexidade do mundo se essa complexidade não fosse harmoniosa; como os míopes, veria apenas 
os detalhes e seria obrigada a esquecer cada um desses detalhes antes de examinar o seguinte, porque incapaz de perceber o 
todo. Os únicos fatos dignos de nossa atenção são os que introduzem ordem nessa complexidade e a tornam acessível a nós. 


HENRI POINCARÉ 


18.1 Introdução 


A origem da dinâmica não-linear remonta ao trabalho do famoso matemático francês Henri Poincaré sobre 
Mecânica Celestial na virada do século XX. A Mecânica Clássica é, em geral, não-linear em sua dependência das 
coordenadas das partículas e das velocidades, por exemplo, vibrações com uma força restauradora não-linear. As 
equações de Navier-Stokes são não-lineares, o que torna a Hidrodinâmica difícil de manipular. Contudo, durante 
quase quatro séculos, seguindo os passos de Galileu, Newton e outros, os físicos se concentraram em respostas 
previsíveis, efetivamente lineares de sistemas clássicos, que usualmente têm propriedades lineares e não-lineares. 

Poincaré foi o primeiro a entender a possibilidade de comportamento completamente irregular ou “caótico” de 
soluções de equações diferenciais que são caracterizadas por uma extrema sensibilidade a condições iniciais: 
dadas condições iniciais ligeiramente diferentes, por erros de medida, por exemplo, soluções podem se desviar 
exponencialmente ao longo do tempo, de modo que o sistema se torna efetivamente imprevisível, ou “caótico”. 
Essa propriedade do caos, muitas vezes denominada efeito “borboleta”, será discutida na Seção 18.3. Desde a 
redescoberta desse efeito por Lorenz em meteorologia no início da década de 1960, o campo da dinâmica não-linear 
teve um tremendo crescimento. Assim, a dinâmica não-linear e a teoria do caos agora fazem parte da tendência 
dominante da Física. 

Foi constatado que numerosos exemplos de sistemas não-lineares apresentavam comportamento irregular. 
Surpreendentemente, ordem, no sentido de similaridades quantitativas como propriedades universais ou outras 
irregularidades podem surgir espontaneamente no caos. Um primeiro exemplo são os números universais de 
Feigenbaum, a e à, que aparecerão na Seção 18.2. Caos dinâmico não é um fenômeno raro, mas está por toda parte 
na natureza. Inclui as formas irregulares das nuvens, o contorno da costa e outras paisagens, que são exemplos de 
fractais, que serão discutidos na Seção 18.3, e fluxo turbulento de fluidos, água pingando de uma torneira e o clima, 
é claro. O pêndulo forçado atenuado está entre os sistemas mais simples que apresentam movimento caótico. 

Condições necessárias para movimento caótico em sistemas dinâmicos descritos por equações diferenciais de 
primeira ordem são 


e ao menos três variáveis dinâmicas e 
e um ou mais termos não-lineares ligando duas ou várias delas. 


Como na Mecânica Clássica, o espaço das variáveis dinâmicas dependentes do tempo de um sistema de equações 
diferenciais acopladas é denominado seu espaço de fase. Em tais sistemas determinísticos, trajetórias no espaço de 
fase não podem se cruzar. Se o fizessem, o sistema teria uma opção em cada interseção e não seria determinístico. 
Em duas dimensões, tais sistemas não-lineares permitem apenas pontos fixos. Um exemplo é um pêndulo atenuado 
cuja derivada de segunda ordem, ô = f (0, 9), pode ser escrita como suas derivadas de primeira, w = 0, 
w = f(w,0), envolvendo apenas duas variáveis dinâmicas, w(t) e O(t). No caso não-atenuado, haverá apenas 
movimento periódico e pontos de equilíbrio. Com três ou mais variáveis dinâmicas (por exemplo, pêndulo 
atenuado, forçado, escrito novamente como EDOs acopladas de primeira ordem) são possíveis trajetórias mais 
complicadas que não se interceptam. Elas incluem o movimento caótico e são denominadas caos determinístico. 

Um tema central em caos é a evolução de formas complexas pela repetição de operações simples mas não- 
lineares, o que está sendo reconhecido como um princípio de organização fundamental da natureza. Enquanto 
equações diferenciais não-lineares são um lugar natural na Física para ocorrer o caos, a iteração matematicamente 
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mais simples de funções não-lineares oferece uma entrada mais rápida na teoria do caos, que discutiremos na Seção 
18.2. Nesse contexto, o caos já surge em certas funções não-lineares de uma única variável. 


18.2 O Mapa Logístico 


A iteração não-linear unidimensional, ou equação de diferenças, 
En+1 = UEn(l — £n), £n € [0,1]; I<uc<a4, (18.1) 


é denominada mapa logístico. Seu padrão segue o da equação diferencial não-linear dx /dt = ua(1 — x), usada 
por P. F. Verhulst, em 1845, para modelar o desenvolvimento de uma população prolífera cujas gerações não se 
sobrepõem. A densidade populacional no tempo n é x,. O termo linear simula a taxa de nascimentos, e o termo 
não-linear, a taxa de óbitos da espécie em um ambiente constante controlado pelo parâmetro ju. 


0,6 
0,5 A 
0,4 
z 03 
R 
0,2 
0,1 


A) 0 0,2 0,4 0,6 0,8 1 


Figura 18.1: Ciclo (£o, x1, . . .) para o mapa logístico para u = 2, valor inicial xo = 0, 1 e atrator x* = 1/2. 


A função quadrática f(x) = uz(1 — x) é escolhida porque tem um máximo no intervalo [0,1] e é zero nas 
extremidades, f,.(0) = 0 = fa(1). O máximo em £m = 1/2 é determinado por f'(x) = 0, isto é, 


filtm)=u(l-22m)=0,  Im= (18.2) 


em que fa (1/2) = u/4. 


e Variar o único parâmetro u controla um comportamento rico e complexo, incluindo caos unidimensional, como 
veremos. Nesse ponto, dificilmente seriam necessários mais parâmetros e variáveis adicionais para aumentar a 
complexidade. Em um sentido bastante qualitativo, o simples mapa logístico da Equação (18.1) é representativo 
de muitos sistemas dinâmicos em Biologia, Química e Física. 


A Figura 18.1 mostra um gráfico de f„(x) = ua(1l — x) juntamente com a diagonal e uma série de pontos 
(xo, %1,...) ciclo. Para construir um ciclo para um valor fixo de u (= 2 na Figura 18.1), escolhemos algum 
xo € [0,1] [xo = 0,1 na Equação (18.1). A reta vertical que passa por x, intercepta a curva f(x) em x, = fu(xo) 
(= 0,18 na Figura 18.1. Prosseguindo no sentido horizontal, a partir de xı chegamos a xı na diagonal. Partindo 
da abscissa xı no sentido vertical, temos £2 = fala) sobre a curva (£2 = 0,2952 na Figura 18.1) etc. Isto é, 
retas verticais mostram as interseções com a curva f, e retas horizontais convertem f, (x;) = x;41 para a próxima 
abscissa. 

Para qualquer valor inicial xo com O < xo < 1, os x; convergem na direção do ponto fixo x* ou atrator 
[= (0,5,0,5) na Figura 18.1]: 


1 
fule) = px* (1 — x*) = z*, ie., al=1]——. (18.3) 
u 
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O intervalo (0,1) define uma bacia de atração para o ponto fixo x*. O atrator x* é estável, contanto que a curva 
; ção p p q 


Filo) = |2— u| <1o0u1 < u < 3, 0 que pode ser visto por uma expansão de Taylor de uma iteração perto do 
atrator: 
* * * : x — q * 
Tn+1 = Fuln) = falz JF fala (an= t") H L.e., x = alz js 
no 


descartando os termos de ordem mais alta. Assim, se | fala) < 1,0 próximo iterado, x,-,1, está mais perto de 
x* do que £n, o que implica convergência e estabilidade do ponto fixo. Contudo, se | fi, (1*)| > 1, £n+1 se afasta 
mais de x* do que £n, o que implica divergência e instabilidade. Dada a continuidade de Fi em 4, o ponto fixo e 
suas propriedades persistem quando o parâmetro (aqui u) sofre uma ligeira variação. 

Para u > 1 e xo < 0 ou zo > 1, é fácil verificar por meios gráficos ou analíticos que os x; — —oo. À origem, 
x = 0, é um ponto fixo repulsor, uma vez que Íi (0) = u > 1 e os iterados se afastam dele. Visto que FL) = —4, 
o ponto x = 1 é um repulsor para u > 1. 


1,0 
0.8 


0,6 


x* 


0,4 


u 


Figura 18.2: Parte do gráfico de bifurcação para o mapa logístico: pontos fixos x* versus p. 


Quando 
fla)=u(l-22*)=2-p=—1 


é alcançado para u = 3, ocorrem dois pontos fixos, representados como os dois ramos na Figura 18.2, à medida 
que u passa do valor 3. Eles podem ser localizados resolvendo 


23 = Ju(fula3)) = uai — 23) — uaz(l — a3)], 


para zš. Aqui é conveniente abreviar fŒ} (x) = fu(x), f® (x) = ful fu(£)) para o segundo iterado etc. Agora 
descartamos o x5 comum e então reduzimos o polinômio de terceira ordem remanescente para segunda ordem, 
lembrando que um ponto fixo de f, também é um ponto fixo de f®) porque fu (fu(£*)) = fula*) = «*. Assim, 
x3 = x“ é uma solução. Fatorando o polinômio quadrático, obtemos 
0 = vê [1 — (u + 1)x3 + 2(23)? — u(23)°] —1 
= (u—1 > pa) [nu +1- u(n + as + pu? (a05)?]. 


As raízes do polinômio quadrático são 


= 
To = 


ut 1+ (u+D(u—3)), 


que são os dois ramos na Figura 18.2 para u > 3 começando em zš = 2/3. Isso mostra que ambos os pontos 
fixos se bifurcam nos mesmos valores de u. Cada x5 é um ponto de período 2 e invariante sob duas iterações do 
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mapa f,. Os iterados oscilam entre ambos os ramos de pontos fixos x3. Um ponto x, é definido como um ponto 
periódico de período n para f, se f™ (x0) = xo, mas f® (x0) Æ xo para O < i < n. Assim, para3 < p < 3,45 
(veja a Figura 18.2), o atrator estável se bifurca, ou se subdivide, em dois pontos fixos x3. A bifurcação para 
|! = 3, onde ocorre a duplicação, é denominada bifurcação em garfo por causa de sua forma característica (um Y 
arredondado). Uma bifurcação é uma mudança repentina na evolução do sistema, tal como a subdivisão de uma 
curva em duas curvas. 

À medida que p passa de 3, a derivada df® (da decresce da unidade até —1. Para u = 14 v6 ~ 3, 44949, que 
pode ser derivado de 


df) 


de = —1, fP (2*) = 2º, 


a=u* 


cada ramo de pontos fixos se bifurca novamente, portanto x; = f (4) (x1), isto é, tem período 4. Para u = 1 + v6 
são x4 = 0,43996 e x4 = 0, 49938. 

Com as crescentes duplicações de período, fica impossível obter soluções analíticas. As iterações são melhores 
quando feitas numericamente com uma máquina de calcular ou um computador, cujas rápidas melhorias (gráficos 
por computador, em particular) e ampla distribuição desde a década de 1970 aceleraram o desenvolvimento da 
teoria do caos. A segiiência de bifurcações continua com períodos cada vez mais longos até alcançar us = 
3,5699456 ..., onde ocorre um número infinito de bifurcações. Perto de pontos de bifurcação, flutuações, erros 
de arredondamento nas condições iniciais etc., desempenham um papel cada vez maior porque o sistema tem de 
escolher entre dois amos possíveis e se torna muito mais sensível a pequenas perturbações. No presente caso, os x, 
nunca se repetem. As faixas de pontos fixos x* começam a formar um contínuo (em preto na Figura 18.2); é aí que 
começa o caos. Essa crescente duplicação de período é a rota para o caos para o mapa logístico que é caracterizada 
por uma constante universal ô, denominada número de Feigenbaum. Se a primeira bifurcação ocorrer em | = 3, 
a segunda em ju, = 3,45,..., então a razão entre os espaçamentos entre os u,„ converge para ô: 


Pn Pani = S = 4, 66920161... (18.4) 


Pelo gráfico da bifurcação na Figura 18.2, obtemos 


Mo =H _ 3,45-3,00 + 


= =5,0 
H3 — lo 3,54-3,45 


como uma primeira aproximação para ô, que é adimensional. Os correspondentes pontos x; de período crítico 2n 
levam a uma outra quantidade universal adimensional: 


. Em = fni 
lim 2 ri = a = 2,5029... (18.5) 
n—00 Tay1 = Tn 


Novamente lendo valores aproximados para xž na Figura 18.2, obtemos 


0,44—0,67 


0,37-0,4 7>’ 


como uma primeira aproximação para a. 

O número ô de Feigenbaum é universal para a rota para o caos via duplicações de período para todos os 
mapas com um máximo quadrático similar ao mapa logístico. É um exemplo de ordem no caos. A experiência 
mostra que sua validade é ainda mais ampla, incluindo sistemas bidimensionais (dissipativos) e funções duas vezes 
diferenciáveis continuamente com bifurcações subarmônicas.! Quando os mapas se comportam como |£ — xm|!** 
perto de seu máximo £m para algum € entre O e 1, o número de Feigenbaum dependerá do expoente £; assim, ó(£) 


varia entre 9(1) dado na Equação (18.4) para mapas quadráticos e (0) = 2 para € = 0:? 


l Mais detalhes e códigos de computador para o mapa logístico são dados por G. L. Baker e J. P. Gollub, Chaotic Dynamics: An Introduction, 
Cambridge, UK: Cambridge University Press (1990). 

2Se o leitor quiser outros mapas e uma discussão sobre a fascinante história de como o caos se tornou novamente um tópico crítico de 
pesquisa, veja D. Holton e R. M. May, The Nature of Chaos (T. Mullin, ed.), Oxford, UK: Clarendon Press (1993), Seção 5, p. 95; e o livro de 
Gleick Chaos (1987), veja as Leituras Adicionais. 
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Exercícios 
18.2.1 Mostre que x* = 1 é um ponto fixo não-trivial do mapa 7,41 = Zn exp[r(1 — x,)] com uma 
inclinação 1 — r, de modo que o equilíbrio é estável se 0 < r < 2. 


18.2.2 Desenhe um diagrama de bifurcação para o mapa exponencial do Exercício 18.2.1 para r > 1,9. 
18.2.3 Determine pontos fixos do mapa cúbico £n+1 = ar? +(1—a)zn, para0 <a<4e0 < ztn <1. 


18.2.44 Escreva o mapa logístico atrasado no tempo £n+1 = HZn(l1— £n—1) como um mapa bidimensional 
n41 = UTn(1 — Yn), Yn+1 = Tn, € determine alguns de seus pontos fixos. 


18.2.5 Mostre que a segunda bifurcação para o mapa logístico que leva a ciclos de período 4 está localizada 
em u = 1 + 6. 
18.2.6 Construa uma função iteração não-linear com ô de Feigenbaum no intervalo 2 < ô < 4, 6692... 


18.2.7 Determine o delta de Feigenbaum para (a) o mapa exponencial do Exercício 18.2.1, (b) algum mapa 
cúbico do Exercício 18.2.3, (c) o mapa logístico atrasado no tempo do Exercício 18.2.4. 


18.2.8 Repita o Exercício 18.2.7 para o a de Feigenbaum em vez do ô. 


18.2.9 Ache, por meios numéricos, os primeiros quatro pontos u para duplicação de período do mapa 
logístico e então obtenha as primeiras duas aproximações para o ô de Feigenbaum. Compare com a 
Figura 18.2 e a Equação (18.4). 


18.2.10 Ache, por meios numéricos, os valores u onde o ciclo de período 1, 3, 4, 5, 6 começa e, em seguida, 
onde ele se torna instável. 


Valores de verificação. Para período 


3 
4, 
5 
6, 


18.2.11 Repita o Exercício 18.2.9 para o a de Feigenbaum. 


18.3 Sensibilidade a Condições Iniciais e Parâmetros 
Expoentes de Lyapunov 


Na Seção 18.2 descrevemos como, ao nos aproximarmos por baixo do valor do parâmetro de acumulação de 
duplicação de período u = 3,5699 ..., o período n + 1 de ciclos (£o, £1, ..., £n) com n41 = Zo fica mais 
longo. Também é fácil verificar que as distâncias 


da = |f™ (z0 + €) — f™ (z0)| (18.6) 


crescem para £ > 0 pequeno. Por experiência com comportamento caótico, constatamos que essa distância aumenta 
exponencialmente com n — o9; isto é, dn /€ = eò” ou 


dad p(t ame) 


n E 


(18.7) 


em que À, é um expoente de Lyapunov para o ciclo. Para € — 0, podemos reescrever a Equação (18.7) em termos 
de derivadas como 


a=- g eile Anis (x;)|, (18.8) 
usando a regra da cadeia da diferenciação para df (a) /da, em que 
faro) _ dfu df, A , 
“do Td de | T 18. 
da dx v=fu(xo) da L=T0 ful21)fy(20) (18.9) 


e fi = dfuldz, etc. Nosso expoente de Lyapunov foi calculado no ponto xo, e a Equação (18.8) é exata para 
mapas unidimensionais. 

Como uma medida da sensibilidade do sistema a mudanças em condições iniciais, um único ponto não é 
suficiente para determinar À em sistemas dinâmicos de número mais alto de dimensões em geral, no qual o 
movimento muitas vezes é limitado, de modo que dn não pode ir a oo. Nesses casos, repetimos o procedimento 


“livro” — 2007/81 — 15:06 — page 823 — #833 


ELSEVIER 18. MÉTODOS NÃO-LINEARES E CAOS 823 


para diversos pontos na trajetória e calculamos a média entre eles. Desse modo, obtemos o expoente médio de 
Lyapunov para a amostra. Esse valor médio costuma ser denominado e considerado como o expoente de Lyapunov. 

O expoente de Lyapunov À é uma medida quantitativa do caos: uma função unidimensional iterada semelhante 
ao mapa logístico tem ciclos caóticos (xo, £1, ...) para o parâmetro u se o expoente médio de Lyapunov for 
positivo para o valor de u. Qualquer ponto inicial xy como esse é denominado atrator estranho ou caótico 
(a região sombreada na Figura 18.2). Para ciclos de período finito, À é negativo. Esse é o caso para u < 3, para 
H < Ha» € até mesmo na janela periódica em u ~ 3,627 dentro da região caótica da Figura 18.2. Em pontos de 
bifurcação, À = O. Para u > u,» O expoente de Lyapunov é positivo, exceto nas janelas periódicas em que À < 0, 
e À cresce com pu. Em outras palavras, o sistema se torna mais caótico à medida que o parâmetro de controle u 
aumenta. 

Na região de caos do mapa logístico há uma lei de elevação para o expoente médio de Lyapunov (não a 
derivamos), 


Mu) = Ao(u — Ho) ®?/ ™?, (18.10) 


em que ln2/lnô ~ 0,445, ô é o número universal de Feigenbaum da Seção 18.2, e Ao é uma constante. Essa 
relação (18.10) lembra uma relação física observável em uma transição de fase (de segunda ordem). O expoente na 
Equação (18.10) é um número universal; o expoente de Lyapunov desempenha o papel de parâmetro de ordem, 
enquanto 4 — u é O análogo de T — T.., em que T, é a temperatura crítica na qual ocorre a transição de fase. 


Fractais 


Em sistemas dissipativos caóticos (mas raramente em sistemas hamiltonianos conservativos), muitas vezes 
aparecem objetos geométricos de formas intrincadas que são denominados fractais porque suas dimensões não 
são números inteiros. Fractais são objetos geométricos irregulares cuja dimensão é tipicamente não-inteira e 
que existem em muitas escalas, de modo que suas partes menores são parecidas com suas partes maiores. 
Intuitivamente, um fractal é um conjunto que é (aproximadamente) similar a si mesmo sob ampliação. Um 
conjunto de pontos de atração com dimensões não-inteiras é denominado atrator estranho. 

Precisamos de uma medida quantitativa de dimensionalidade para descrever fractais. Infelizmente, há várias 
definições com valores numéricos usualmente diferentes, nenhuma das quais, até o momento, se transformou em 
padrão. Para conjuntos estritamente similares a si mesmos basta uma medida. Conjuntos mais complicados (por 
exemplo, apenas aproximadamente similares a si mesmos) requerem mais medidas para sua completa descrição. 
A mais simples é a dimensão de contagem de caixas, devida a Kolmogorov e Hausdorff. Para um conjunto 
unidimensional, cobrimos a curva com segmentos de reta de comprimento R. Em duas dimensões as caixas são 
quadrados de área R?, em três dimensões são cubos de volume R? etc. Então contamos o número N(R) de caixas 
necessárias para cobrir o conjunto. Deixando R ir a zero, esperamos que N aumente de acordo com N(R) ~ R-*. 
Considerando logaritmo, a dimensão de contagem de caixas é definida como 


d = lim BENI 


18.11 
R50 InR SAT) 


Por exemplo, em um espaço bidimensional, um ponto único é coberto por um só quadrado, portanto ln N(R) = 0 
e d = 0. Um conjunto finito de pontos isolados tem dimensão d = 0. Para uma curva diferenciável de comprimento 
L, N(R) ~ L/R quando R — 0, portanto d = 1 pela Equação (18.11), como esperado. 

Agora vamos construir um conjunto mais irregular, a curva de Koch. Começamos com um segmento de reta 
de comprimento unitário na Figura 18.3 e removemos o terço do meio. Então o substituímos por dois segmentos 
de comprimento 1/3, que formam um triângulo na Figura 18.3. Iteramos esse procedimento com cada segmento 
ad infinitum. A curva de Koch resultante é infinitamente longa e não-diferenciável em nenhum lugar por causa do 
número infinito das muitas mudanças descontínuas na inclinação. Na enésima etapa cada segmento de reta tem 
comprimento R, = 37” e existem N(R,) = 4” segmentos. Daí, sua dimensão é d = In4/ln3 = 1,26..., 
que é mais do que uma curva, porém menos do que uma superfície. Como a curva de Koch resulta da iteração da 
primeira etapa, ela é estritamente similar a si mesma. 

Para o mapa logístico, a dimensão de contagem de caixas em um ponto de acumulação de duplicação de 
período us, é 0,5388..., que é um número universal para iterações de funções de uma variável com um máximo 
quadrático. Para ter uma idéia aproximada de como isso ocorre, considere os pares de segmentos de reta originários 
de sucessivos pontos de bifurcação para um dado parâmetro u no regime de caos (veja a Figura 18.2). Imagine 
remover o espaço interior das faixas caóticas. Quando passamos para a próxima bifurcação, o parâmetro de escala 
relevante é a = 2,5029... da Equação (18.5). Suponha que precisamos de 2” segmentos de reta de comprimento 
R para cobrir 2” faixas. Então, no estágio seguinte precisamos de 2”+! segmentos de comprimento R/a para 
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Figura 18.3: Construção da curva de Koch por iterações. 


cobrir as faixas. Isso tem como resultado uma dimensão d = — In(2" /2”+1)/ln a = 0,4498... Essa estimativa 
grosseira pode ser melhorada levando em conta que a diferença entre a largura entre pares vizinhos de segmentos 
é de 1/a (veja a Figura 18.2). A estimativa melhorada, 0,543, é mais próxima de 0,5388. . . Esse exemplo sugere 
que, quando o conjunto fractal não tem uma estrutura simples similar a si mesma, então a dimensão de contagem 
de caixas depende do método de construção das caixas. 

Por fim, passamos para os belos fractais que são surpreendentemente fáceis de gerar e cujas fotos em cores 
causam um impacto considerável. Para c = a + ib, complexo, o mapa complexo quadrático correspondente 
envolvendo a variável complexa z = x + iy, 


Zn41 = 22 +0, (18.12) 
parece enganadoramente simples, mas o mapa bidimensional equivalente em termos das variáveis reais 
2 2 
Tn+1 = Ti — Yn + GQ, Yn+1 = 2XnYn + b (18.13) 


já revela mais de sua complexidade. Esse mapa forma a base para algumas das lindas fotos multicoloridas 
de fractais de Mandelbrot (remetemos o leitor a Mandelbrot (1988) e Peitgen e Richter (1986) nas Leituras 
Adicionais), e constatou-se que ele gera formas bastante intrincadas para vários c # 0. Por exemplo, o conjunto 
de Julia de um mapa zn+1 = F(zn) é definido como o conjunto de todos os seus pontos repulsores fixos ou 
periódicos. Assim, ele forma a fronteira entre condições iniciais de um mapa bidimensional iterado que leva a 
iterados que divergem e os que continuam dentro de alguma região finita do plano complexo. Para o caso c = 0 e 
F(z) = 22, pode-se mostrar que o conjunto de Julia é apenas um círculo em torno da origem do plano complexo. 
Ainda assim, basta somar uma constante c Æ 0, e o conjunto de Julia se torna fractal. Por exemplo, para c = —1, 
encontramos um colar fractal com um número infinito de laços (veja Devaney (1989) nas Leituras Adicionais). 

Enquanto o conjunto de Julia é desenhado no plano complexo, o conjunto de Mandelbrot é construído 
no espaço paramétrico bidimensional c = (a,b) = a + bi da seguinte maneira. Partindo do valor inicial 
zo = 0 = (0,0) pesquisamos a Equação (18.12) em busca de valores de parâmetros c, de modo que os {2n} 
iterados não divirjam ao co. Cada cor fora da fronteira fractal do conjunto de Mandelbrot representa um número 
dado de iterações m, por exemplo, necessárias para que os z, passem de um valor absoluto (real) especificado 
R, |zm| > R > |zm-1l. Para o valor de parâmetro real c = a, o mapa resultante, £n+1 = £2 + a, é equivalente 
ao mapa logístico com bifurcações de duplicação de período (veja a Seção 18.2), à medida que a aumenta no eixo 
real dentro do conjunto de Mandelbrot. 
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Exercícios 

18.3.1 Use uma calculadora programável (ou um computador com software BASIC ou FORTRAN ou 
simbólico como Mathematica ou Maple) para obter os x; iterados de um 0 < xo < 1e fa (xi) para 
o mapa logístico. Então calcule o expoente de Lyapunov para ciclos de período 2,3, ... do mapa 
logístico para 2 < u < 3,7. Mostre que, para u < Ha, O expoente de Lyapunov À é O em pontos 
de bifurcação e negativo em todos os outros lugares, enquanto para u > Ha ele é positivo, exceto 
em janelas periódicas. 
Sugestão: Veja a Figura 9.3 de Hilborn (1994) nas Leituras Adicionais. 


18.3.2 Considere o mapa x,41 = F(x,) com 


_ Ja+br, x<l, 
O PR x>1, 


para b > 0ed < 0. Mostre que seu expoente de Lyapunov é positivo quando b > 1, d < —1. 
Construa um gráfico com algumas iterações no plano (£n+1, £n). 


18.4 Equações Diferenciais Não-Lineares 


z = 0 Superfície 


Figura 18.4: Quadro esquemático de uma seção de Poincaré. 


Na Seção 18.1 mencionamos equações diferenciais não-lineares (abreviadamente EDNs) como o lugar natural 
da Física para ocorrência de caos, mas continuamos com a mais simples iteração de funções não-lineares de uma 
variável (mapas). Aqui abordamos brevemente a área muito mais ampla das EDNs e a complexidade muito maior 
no comportamento de suas soluções. Contudo, mapas e sistemas de soluções de EDNs guardam uma estreita 
relação entre si. Os últimos muitas vezes podem ser analisados em termos de mapas discretos. Uma prescrição 
é denominada seção de Poincaré de um sistema de soluções de EDN. Colocando um plano transversal em uma 
trajetória (de uma solução de uma EDN), ela intercepta o plano em uma série de pontos em tempos discretos 
crescentes, por exemplo, na Figura 18.4 (x(t1), y(t1)) = (z1, y1), (£2, Y2), ..., que são registrados e analisados 
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por meios gráficos ou numéricos em busca de pontos fixos, bifurcações de duplicação de período, etc. Esse método 
é útil quando soluções de EDNs são obtidas por meios numéricos em simulações por computador, de modo que 
podemos gerar seções de Poincaré em várias localizações e com orientações diferentes, sendo que análise ulterior 
leva a mapas bidimensionais iterados 


Tn+1 = Flag, Yn), Yn+1 = Fo(£n, Yn) (18.14) 


armazenados pelo computador. Entretanto, nem sempre é fácil extrair as funções F; por meios analíticos ou 
gráficos. 

Vamos começar com alguns exemplos clássicos de EDNs. No Capítulo 9 já discutimos a solução sóliton da EDP 
não-linear de Korteweg-de Vries, Equação (9.11). 


Exercício 


18.4.1 Considere a seção de Poincaré {x > 0,y = à = 0} para o oscilador harmônico atenuado 
t+2az+ar=0. 
Considere O < a <1 e mostre que o mapa é dado por x, 4,1 = b£n com b < 1. Faça uma estimativa para b. 


Equações de Bernoulli e Riccati 
Equações de Bernoulli também são não-lineares e têm a forma 


y (x) = p(z)y(x) + a(x) [y(x)]”, (18.15) 


em que p e q são funções reais e n 0, 1 para excluir EDOs lineares de primeira ordem. Se substituirmos 


ulz) = [y(2)] ”, (18.16) 


então a Equação (18.15) se torna uma EDO linear de primeira ordem, 
u=(1-my"y'=(1-n)[p(x)u(x) + a(x)], (18.17) 


que podemos resolver como descrito na Seção 9.2. 
Equações de Riccati são quadráticas em y(x): 


y = p(2)y” + a(a)y + r(a), (18.18) 


em que p 0 para excluir EDOs lineares e r Æ O para excluir equações de Bernoulli. Não há nenhum método geral 
para resolver equações de Riccati. Contudo, quando se conhece uma solução especial yo(x) da Equação (18.18) 
por um palpite ou inspeção, então podemos escrever a solução geral na forma y = yo + u, sendo que u satisfaz a 
equação de Bernoulli 

u! = pu? + (2pyo + qu, (18.19) 


porque a substituição de y = yo + u na Equação (18.18) remove r(x) da Equação (18.18). 

Exatamente como no caso das equações de Riccati, não há nenhum método geral para obter soluções exatas 
de outras EDOs não-lineares. É mais importante desenvolver métodos para achar o comportamento qualitativo 
de soluções. No Capítulo 9 mencionamos que existem soluções de séries de potências de EDOs, exceto 
(possivelmente) em singularidades regulares ou essenciais, que são dadas diretamente por análise local das funções 
coeficientes da EDO. Tal análise local também nos fornece o comportamento assintótico de soluções. 


Singularidades Fixas e Móveis, Soluções Especiais 


Soluções de EDNs também têm tais pontos singulares, independentes das condições iniciais ou de contorno e 
denominados singularidades fixas. Além disso, elas podem ter singularidades espontâneas, ou móveis, que 
variam com as condições iniciais ou de contorno. Elas complicam a análise (assintótica) de EDNs. Esse ponto 
é ilustrado por comparação com a EDO linear 


y + =0, (18.20) 
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que tem a óbvia singularidade regular em x = 1, com a EDN y’ = y?. Ambas têm a mesma solução com condição 
inicial y(0) = 1, a saber, y(x) = 1/(1 — x). Todavia, para y(0) = 2, o pólo na solução (óbvia, mas verifique) 
y(x) = 2/(1 — 2x) da EDN passou para x = 1/2. 

Para uma EDO de segunda ordem, temos uma descrição completa (o comportamento assintótico) de suas 
soluções quando são conhecidas (as descrições, os comportamentos assintóticos) de duas soluções linearmente 
independentes. Para EDNs ainda pode haver soluções especiais cujo comportamento assintótico não pode ser 
obtido de duas soluções independentes. Essa é outra propriedade característica de EDNSs, que ilustramos 
novamente por um exemplo. A solução geral da EDN y” = yy'/a é dada por 


y(x) = 2cıtg(cı ln z + c2) — 1, (18.21) 


em que c; são constantes de integração. Uma solução especial óbvia (verifique) é y = c3 = constante, que não 
pode ser obtida da Equação (18) para qualquer escolha dos parâmetros c1, co. Note que, usando a substituição 
x = et, Y(t) = y(e'), de modo que x dy/dx = dY/dt, obtemos a EDO Y” = Y'(Y + 1). Essa EDO pode ser 
integrada uma vez para resultar em Y’ = ¿Y° +Y + c, com c = 2(c? + 1/4) uma constante de integração e, mais 
uma vez, conforme a Seção 9.2, para levar à solução da Equação (18.21). 


Equações Diferenciais Autônomas 


Equações diferenciais que não contêm explicitamente a variável independente, e que aqui consideramos que seja o 
tempo t, são denominadas autônomas. A EDN de Verhulst y = dy/dt = uy(1 — y), que encontramos brevemente 
na Seção 18.2 como motivação para o mapa logístico, é um caso especial dessa ampla e importante classe de 
EDOs.? Para uma variável dependente y(t), elas podem ser escritas como 


ý = f(y), (18.22a) 


e para diversas variáveis dependentes, como um sistema 
Yi = fly Y2- cs Yn)» 1=1,2,...,n, (18.22b) 


com funções suficientemente diferenciáveis f, f;. Uma solução da Equação (18.22b) é uma curva ou trajetória 
y(t) para n = 1 e, em geral, uma trajetória (y1 (t), y2(t), - - - , Yn(t)) em um (assim denominado) espaço de fase n 
dimensional. Como já discutimos na Seção 18.1, duas trajetórias não podem se cruzar por causa da unicidade das 
soluções de EDOs. Claramente, soluções do sistema algébrico 


fly yo.) =0 (18.23) 


são pontos especiais no espaço de fase, onde a posição do vetor (y1, y2,...,Yn) não se move na trajetória; eles são 
denominados pontos críticos (ou fixos). Acontece que uma análise local de soluções perto de pontos críticos nos 
leva a entender o comportamento global das soluções. Primeiro, vamos examinar um exemplo simples. 

Para a EDO de Verhulst, f(y) = uy(l — y) = 0 resulta em y = 0 e y = 1 como os pontos críticos. Para o 
mapa logístico, y = 0 e y = 1 são pontos repulsores fixos porque df /dy(0) = u em y = 0 e df/dy(l) = —u 
em y = 1, para u > 1. Uma análise local perto de y = 0 sugere desprezar o termo y? e resolver ý = uy em seu 
lugar. Integrando f dy/y = ut + lnc, temos como resultado a solução y(t) = ce”*, que diverge quando t — oo, 
portanto, y = 0 é um ponto crítico repulsor. (Note que para u < 0 do mapa logístico o ponto crítico y = 0 seria 
atrator, levando a uma solução convergente y ~ e”*.) De modo semelhante em y = 1, f dy/(1 — y) = ut -lnc 
leva a y(t) = 1 — cet! — 1, para t — œ. Por conseguinte, y = 1 é um ponto crítico atrator. Como a EDO é 
separável, sua solução geral é dada por 


Ee e 
-—— = | dy|- + —| =n = ut+lnc. 
Joa y 1l-y l—y 


Por conseguinte, y(t) = cet /(1 + ce”) porque t — oo converge para 1, confirmando assim a análise local. Esse 
exemplo nos motiva a examinar com mais detalhes as propriedades de pontos fixos. Para uma função arbitrária f, 
é fácil ver que 


3 Soluções de equações não-autônomas podem ser muito mais complicadas. 
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e em uma dimensão, pontos fixos y; com f(y;) = O dividem o eixo y em intervalos dinamicamente separados 
porque, dado um valor inicial em um dos intervalos, a trajetória y(t) permanecerá ali, porque ela não pode passar 
de qualquer dos pontos fixos em que ġ = 0. 


Se f(yo) > 0 no ponto fixo yo em que f(yo) = 0, então em yo + £ para € > 0 suficientemente pequeno, 
ý = f'(yo)e + O(c?) > 0 em uma vizinhança à direita de yo, portanto a trajetória y(t) continua se movendo para 
a direita, afastando-se do ponto fixo yo. À esquerda de yo, ý = — f “(yo)e + O(c?) < 0, portanto, aqui, a trajetória 
também se afasta do ponto fixo. Por conseguinte, 


e um ponto fixo [com f(wyo) = 0] em yo com f'(yo) > 0, como mostra a Figura 18.5a, repele trajetórias; isto é, 
todas as trajetórias se afastam do ponto crítico: -.. — - — ...: ele é um repulsor. De modo semelhante, vemos 
que 

e um ponto fixo em yo com f'(yo) < 0, como mostra a Figura 18.5b, atrai trajetórias, isto é, todas as trajetórias 
convergem em direção ao ponto crítico yo: --- — - — ---: ele é um sorvedouro ou nó. 


fo) 


fO)>0 


Yo 


(a) (b) 


Figura 18.5: Pontos fixos: (a) repulsor, (b) sorvedouro. 


Agora vamos considerar o caso restante quando f'(yoọ) = 0. 

Vamos admitir que f” (yo) > 0. Então, em yo + £ à direita do ponto fixo yo, y = f” (yo)e?/2 + O(e?) > 0, 
portanto, ali, a trajetória se afasta do ponto fixo, ao passo que à esquerda ela se aproxima de yo. Em outras palavras, 
temos um ponto de sela. Para f” (yo) < 0, o sinal de ġ é invertido, de modo que, mais uma vez se trata de um 
ponto de sela que se move à direita de yo em direção ao ponto fixo e, à esquerda, se afasta dele. Vamos resumir o 
comportamento local de trajetórias perto de um tal ponto fixo yo: temos 


e um ponto de sela em yo quando f(yo) = 0, e f'(yo) = 0, como mostra a Figura 18.6a,b correspondente aos 
casos em que (a) f” (yo) > 0 e trajetórias de um lado do ponto crítico convergem em direção a ele e, do outro 
lado, divergem em relação a ele: - -- — - > -..:e (b) f” (yo) < 0. Aqui, a direção é simplesmente invertida em 
comparação com (a). A Figura 18.6(c) mostra os casos em que f” (yo) = 0. 


Até aqui ignoramos a dependência adicional de f(y) em relação a um ou mais parâmetros, tal como p para 
o mapa logístico. Quando um ponto crítico mantém suas propriedades em termos qualitativos quando ajustamos 
ligeiramente um parâmetro, nós o denominamos estruturalmente estável. Isso é razoável porque, em termos 
estruturais, é improvável que ocorram objetos instáveis na realidade, porque ruído e outros graus de liberdade 
desprezados agem como perturbações sobre o sistema que efetivamente impedem que tais pontos instáveis sejam 
observados. Agora vamos examinar pontos fixos a partir dessa perspectiva. Variando ligeiramente tal parâmetro 
de controle, deformamos a função f, ou podemos apenas deslocar f um pouco para cima ou para baixo ou para 
os lados na Figura 18.5. Isso alterará um pouco a localização yo do ponto fixo com f(yo) = 0, mas manterá o 
sinal de f'(yo). Assim, sorvedouros e repulsores são estáveis, enquanto um ponto de sela, em geral, não é. Por 
exemplo, deslocar f na Figura 18.6a um pouco para baixo cria dois pontos fixos: um é um sorvedouro e o outro, 
um repulsor, e remove o ponto de sela. Uma vez que duas condições devem ser satisfeitas em um ponto de sela, 
eles são menos comuns e importantes porque são instáveis em relação a variações de parâmetros. Contudo, eles 
marcam o contorno entre diferentes tipos de dinâmica e são úteis e significativos para a análise global da dinâmica. 
Agora estamos prontos para considerar os casos de número maior de dimensões, que são mais ricos, porém mais 
complicados. 
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fo) 
> y > 
y 0 X. 


(c) 


Figura 18.6: Pontos de sela. 


Comportamento Local e Global em Número Maior de Dimensões 


Em duas ou mais dimensões começamos a análise local em um ponto fixo (y9,y5,...), com y; = fi(y?, y8, ...) = 
O usando a mesma expansão de Taylor da f; na Equação (18.22b) que usamos para o caso unidimensional. 
Conservando somente as derivadas de primeira ordem, essa abordagem lineariza as EDNs acopladas da 
Equação (18.22b) e reduz suas soluções à Álgebra Linear da seguinte maneira, abreviamos as derivadas constantes 
no ponto fixo como uma matriz F com elementos 


ô fi 
pe 


5 (18.24) 
Yi (y9,y9,-) 


Contudo, comparando com a Álgebra Linear padrão no Capítulo 3, F em geral não é simétrica nem hermitiana. O 
resultado é que seus autovalores podem não ser reais. Se deslocarmos o ponto fixo até a origem e denominarmos 
as coordenadas deslocadas x; = y; — yº, então as EDNs acopladas da Equação (18.22b) se tornam 


ti =X fyti, (18.25) 
j 


sto é, EDOs lineares acopladas com coeficientes constantes. Resolvemos a Equação (18.25) isto é, com o Ansatz 
padrão de uma exponencial, 


OSS ee”; (18.26) 
j 
com expoentes constantes A; e uma matriz constante C de coeficientes c;;, portanto c; = (cij, i = 1,2,...) 
forma o j-ésimo vetor coluna de C. Substituindo a Equação (18.26) na Equação (18.25), temos como resultado 
uma combinação linear de funções exponenciais, 


ane EN Jnn, (18.27) 
j 


que são independentes se A;  A;. Esse é o caso geral que focalizaremos, enquanto degenerações em que dois 
ou mais À são iguais requerem um tratamento similar ao dos pontos de sela em uma dimensão. Comparando 
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coeficientes de funções exponenciais com o mesmo expoente, temos como resultado as equações lineares de 
autovalor 


so FikCkj = AjCij ou Fc; = AjCj. (18.28) 
k 


Uma solução não-trivial abrangendo o autovalor À; e o autovetor c; das equações lineares homogêneas (18.28) 
requer que À; seja uma raiz da equação secular (compare com a Seção 3.5): 


det(F—-A-1) =0. (18.29) 
A Equação (18.28) significa que C diagonaliza F, portanto também podemos escrever a Equação (18.28) como 
CORE [Ai Mao (18.30) 


Nas novas (porém em geral não-ortogonais) coordenadas £ ,, definidas como C = x, temos um ponto fixo 


para cada direção £}, porque É j = Ajj, em que A; desempenha o papel de f"(yo) no caso unidimensional. Os 
À são expoentes característicos e, em geral, números complexos. Podemos ver isso substituindo x = Cé na 
Equação (18.25) em conjunção com as Equações (18.28) e (18.30). Assim, essa solução representa a combinação 
independente de pontos fixos unidimensionais, um para cada componente de É e cada um independente das outras 
componentes. Então, em duas dimensões, para A < 0 e A» < 0, temos um sorvedouro em todas as direções. 
Quando ambos os À forem maiores do que 0, teremos repulsores em todas as direções. 


Exemplo 18.4.1 SORVEDOURO ESTÁVEL 
As EDOs acopladas 


t= T, y = —zr — 3y 


têm um ponto de equilíbrio na origem. As soluções têm a forma 


x(t) = cet, y(t) = corel! + co26°%, 
portanto, o autovalor A = —1 resulta de Ac = -—cm, e a solução x = cye*. O determinante da 
Equação (18.29), 
—1— à 0 
a 3 NS 0+HNG+AN=0, 
fornece como resultado os autovalores A, = —1, A» = —3. Como ambos são negativos, temos um sorvedouro 


estável na origem. A EDO para y dá as relações lineares 


Arca = —C11 — 3C21 = — C21, À2C22 = —3022, 
das quais inferimos 2c21 = —Cc11 OU C21 = —c11/2. Como a solução geral conterá duas constantes, ela é dada por 
c 
—t 11 —t —3t 
x(t) = cre", y(t) = =at + coge ™. 


À medida que o tempo t — co, temos y ~ —z/2e x — 0ey — 0, enquanto para t > —œ, y ~ z? e 


x,y — +oo. O movimento em direção ao sorvedouro é indicado por setas na Figura 18.7. Para achar a órbita, 
eliminamos a variável independente, t, e achamos as cúbicas: 


y= T C22 3 
2 el 


Quando ambos os À são maiores do que 0, temos um repulsor. Nesse caso, o movimento é distante do ponto fixo. 
Contudo, quando os À têm sinais diferentes, temos um ponto de sela, isto é, uma combinação de um sorvedouro 
em uma dimensão e um repulsor na outra. Esse tipo de comportamento se generaliza para números maiores de 
dimensões. 
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Figura 18.7: Sorvedouro estável. 


Exemplo 18.4.2 PONTO DE SELA 
As EDOs acopladas 


T=—27—y, y=-2+2y 


têm um ponto fixo na origem. As soluções têm a forma 


x(t) = enc + cre, y(t) = exe page o, 
Os autovalores À = +/5 são determinados por 
a m =) -5=0. 
Substituir as soluções gerais nas EDOs resulta nas equações lineares 
Arc = 2c — C21 = V5c11, A1&21 = =c + 2c = v5ca, 
Aoc = 29 — c22 = —v5cy, Aoc» = —c +20» = —v5cy, 


ou 


(V5+2)cn = —ca, (V5-2)c2 = co, 
(V5-2Den = -cn, (V5+2)c» = cio, 


portanto, c21 = —(2 + v5)c11, co» = (V5 — 2)c12. A família de soluções depende de dois parâmetros, c11, €12. 
Para tempo grande t — oo, o expoente positivo prevalece e y ~ —(v5 + 2)x, enquanto para t — —oo, temos 
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y = (v5 — 2)x. Essas retas são as assíntotas das órbitas. Como —(/5 + 2)(v'5 — 2) = —1, elas são ortogonais. 
Achamos as órbitas eliminando a variável independente, t, como segue. Substituindo os c»;, escrevemos 


2 
y=-—-2g — v5(cnevS — exe, portanto a = —cne + ease VE, 


Agora somamos e subtraímos a solução z(t) para obter 


1 
— (y + 2x) + x = dee VE, (y +2) —- q = Ad 


v5 


que multiplicamos para obter 


1 
v5 


1 
z0 +27)? — z? = —4c12¢11 = constante. 


Figura 18.8: Ponto de sela. 


A forma quadrática resultante, y? + 4xry — x? = constante, é uma hipérbole por causa do sinal ne- 


gativo. A hipérbole está rotacionada no sentido de que suas assíntotas não estão alinhadas com os eixos 
x, y (Figura 18.8). Sua orientação é dada pela direção das assíntotas que encontramos antes. Como 
alternativa, poderíamos achar a direção de distância mínima em relação à origem, procedendo da seguinte 
forma. Igualamos a zero as derivadas de x e y de f+ Ag = x? + y? + A(y? + 4ry — x°) A em que é o 
multiplicador de Lagrange para a restrição hiperbólica. Os quatro ramos das hipérboles correspondem aos 
diferentes sinais dos parâmetros cm e cj». O gráfico da Figura 18.8 representa os casos cy = +1, 
cio = E2 E 
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Contudo, surge um novo tipo de comportamento para um par de autovalores conjugados complexos A, 2 = 
p + ix. Se escrevermos as soluções complexas é, , = exp(pt + ist) em variáveis reais É, = (64 + 65)/2,€. = 
(é — &5) /24 usando a identidade de Euler exp(ix) = cos x + isen x (veja a Seção 6.1), 


E, = exp(pt) cos(«t), E£ = exp(pt)sen(at) (18.31) 


descreve uma trajetória em espiral para dentro em direção ao ponto fixo na origem para p < 0, um nó espiral, e 
em espiral que se afasta do ponto fixo para p > 0, um repulsor espiral. 


Exemplo 18.4.3 PONTO ESPIRAL FIXO 
As EDOs acopladas 


t=-—-v+3y, y = —3x + 2y 


têm um ponto fixo na origem e soluções da forma 


Azt 


z(t) = ce™t + cize ; y(t) = C21 + coget. 


Os expoentes À; > são soluções de 


-1-AÀ 3 


3 o | C+NA-D+9=0, 


ou à? — A +7 = 0. Os autovalores são conjugados complexos, À = 1 /2 + iv 27/2, portanto estamos tratando com 
um ponto espiral fixo na origem (um repulsor porque 1/2 > 0). Substituir as soluções gerais nas EDOs apresenta 
como resultado as equações lineares 


Ac = —en+3ca, Ac = —Scy + 2c21, 
Aoc = —cjp +3co, Aoco2 = —Sci + 2099; 
ou 
(AM +lcen = 3c2, (A —2)cm = —Scn, 
(Ao +I)eo = 3cpo, (Ao — 2)c22 = —3c12, 


as quais, usando os valores de À; », implicam a família de curvas 
z(t) = etl? (eye 2/2 + ce), 


a) 


x v27 E ; 
y(t) = 5 + a ie T — c12€ 
que depende de dois parâmetros, c11, C12. Para simplificar, podemos separar as partes real e imaginária de x(t) 
e y(t), usando a identidade de Euler e'” = cos x + isen x. É equivalente, porém mais conveniente, escolher 


cm = c12 = c/2 e aumentar t — 2t, portanto, com a identidade de Euler, temos 


z(t) = cet cos(V2Tt), yt)= 5 = PE e'sen(V F70). 


Aqui, podemos eliminar t e achar a órbita 


aks = Ee 
TA i 


Para t fixo, esta é a forma quadrática definida positiva x? — xy + y? = constante, isto é, uma elipse. Mas não há 


nenhuma elipse nas soluções porque t não é fixo. Ainda assim, é útil achar sua orientação. Procedemos da seguinte 
maneira. Tendo A o multiplicador de Lagrange como a restrição elíptica, procuramos as direções de distância 
máxima e mínima em relação à origem, formando 


f(£, y) +Agl(x, y) = £? +y? +A(2? — ry +4’), 
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e fazendo 
o A o A 
Aa E T A ESE E E 
ðx Oy 
Por 
2(A + Da = Ay, 2(A+ Dy= Az, 
obtemos as direções 
T A  2X(A++1) 
y XUA+1) A 
ou A? + ŠA + $ = 0. Isso dá como resultado os valores A = —2/3, —2 e as direções y = +v. Em outras 
palavras, nossa elipse está centrada na origem e rotacionada 45°. À medida que variamos a variável independente, 
t, o tamanho da elipse muda, portanto, obtemos a espiral rotacionada mostrada na Figura 18.9 para c = 1. E 


Figura 18.9: Ponto espiral. 


No caso especial, quando p = 0 na Equação (18.31), a trajetória circular é denominada ciclo. Quando trajetórias 
próximas a ele são atraídas, à medida que o tempo passa, ele é denominado ciclo limite, representando movimento 
periódico para sistemas autônomos. 


Exemplo 18.4.4 CENTRO OU CICLO 


A EDO de oscilador harmônico linear atenuado % + w?x = 0 pode ser escrita como duas EDOs acopladas: 
t = —wy, Y= Wi: 


Integrar a EDO resultante do ix + ġy = O resulta nas órbitas circulares x? + y? = constante, que definem um 
centro na origem e são mostradas na Figura 18.10. As soluções podem ser parametrizadas como x = Rcos t, 


“livro” — 2007/8/1 — 15:06 — page 835 — #845 


ELSEVIER 18. MÉTODOS NÃO-LINEARES E CAOS 835 


y = Rsen t, em que R é o parâmetro raio. Elas correspondem aos autovalores complexos conjugados À,» = +iw. 
Podemos verificá-los se escrevermos a solução geral como 


x(t) = ceò + exe, y(t) = Espe + Coe, 
Então os autovalores resultam de 
Pa st ig 
w —À 
E 
Figura 18.10: Centro. 
Outro atrator clássico é o movimento quase-periódico, tal como a trajetória 
x(t) = Asen(wıt + by) + Assen(wat + bo), (18.32) 


em que a razão w1 /w2 é um número irracional. Tais oscilações combinadas ocorrem como soluções de um oscilador 
anarmônico atenuado (sistema não-autônomo de Van der Pol) 


E +22 +wix + br? = fcos(wit). (18.33) 


Em três dimensões, quando há um expoente característico positivo e um par conjugado complexo atrator 
nas outras direções, temos um ponto de sela espiral como uma nova característica. Ao contrário, um expoente 
característico negativo em conjunção com um par repulsor também dá origem a um ponto de sela espiral, onde as 
trajetórias são espirais que se dirigem para fora em duas dimensões, mas são atraídas em uma terceira dimensão. 

Em geral, quando está presente alguma forma de atenuação (ou dissipação de energia), os transientes 
se degradam e o sistema se acomoda em equilíbrio, isto é, um único ponto, ou em movimento periódico 
ou quase-periódico. O movimento caótico em sistemas dissipativos agora é reconhecido como um quarto 
estado, e seus atratores costumam ser denominados estranhos. Em sistemas dissipativos, as condições iniciais 
não são importantes porque as trajetórias terminam em algum ponto atrator. Elas são cruciais em sistemas 
hamiltonianos. Também pode ocorrer caos em sistemas hamiltonianos não-integráveis e, então, ele é denominado 
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caos conservativo. Para esse tópico mais complicado damos como referência o Capítulo 8 de Hilborn (1994) nas 
Leituras Adicionais. 

No caso do pêndulo atenuado forçado, quando trajetórias próximas ao centro (órbita fechada) são atraídas para 
ele, à medida que o tempo passa, essa órbita fechada é definida como um ciclo limite, representando movimento 
periódico para sistemas autônomos. Um pêndulo atenuado usualmente dirige-se à origem (a posição de repouso) 
seguindo uma trajetória espiral; isto é, a origem é um ponto espiral fixo em seu espaço de fase. Quando ativamos 
uma força propulsora, então o sistema se torna formalmente não-autônomo por causa de sua dependência explícita 
em relação ao tempo, mas também fica mais interessante. Nesse caso, podemos denominar o tempo explícito em 
uma força propulsora senoidal como uma nova variável, y, em que wo é uma taxa fixa, na equação de movimento 


w +qw + sen 0 = fsen q, w =b, Y = wot. 


Então aumentamos de 1 a dimensão de nosso espaço de fase (adicionando uma variável) porque py = wo = 
constante, mas mantemos autônomas as EDOs acopladas. Esse pêndulo atenuado forçado tem trajetórias que 
cruzam uma órbita fechada em espaço de fase e voltam a ela em trajetória espiral; ela é denominada ciclo limite. 
Isso acontece para uma faixa de intensidade da força de atenuação f, o parâmetro de controle do sistema. Conforme 
aumentamos f, as trajetórias do espaço de fase passam por vários ciclos limites vizinhos e, mais cedo ou mais tarde, 
se tornam aperiódicas e caóticas. Esses ciclos limites fechados são denominados bifurcações de Hopf do pêndulo 
em sua rota para o caos, nome que se deve ao matemático E. Hopf, que generalizou os resultados de Poincaré para 
essas bifurcações para um número maior de dimensões do espaço de fase. 

Esses sorvedouros ou pontos de sela espirais não podem ocorrer em uma dimensão, mas resta saber se eles 
são estáveis quando ocorrem em mais dimensões. Uma resposta é dada pelo teorema de Poincaré-Bendixson, que 
afirma que qualquer das trajetórias (na região finita a ser especificada em um momento) é atraída para um ponto 
fixo, à medida que o tempo passa, ou se aproxima de um ciclo limite, contanto que o subsistema bidimensional 
relevante permaneça dentro de uma região finita, isto é, não divirja nessa região, quando t — oo. Se o leitor quiser 
uma prova, pode consultar Hirsch e Smale (1974) e Jackson (1989) nas Leituras Adicionais. 

Em geral, quando está presente alguma forma de atenuação, os transientes se degradam e o sistema se acomoda 
em equilíbrio, isto é, um único ponto, ou em movimento periódico ou quase-periódico. Agora o movimento caótico 
é reconhecido como um quarto estado e seus pontos atratores são frequentemente estranhos. 


2 . 
Exercício 
18.4.2 Mostre que as EDOs acopladas (Róssler) 


ty = —%2 — ds, to = £1 + 0112, t3 = a2 + (£1 — a3)£3 


(a) têm dois pontos fixos para a2 = 2, ag = 4,e 0 < aı < 2, 
(b) têm um repulsor espiral na origem e 


(c) têm um atrator caótico espiral para ay = 0,398. 
Dissipação em Sistemas Dinâmicos 


Forças dissipativas fregiientemente envolvem velocidades, isto é, derivadas de primeira ordem de tempo, tal 
como atrito (por exemplo, para o oscilador atenuado). Vamos procurar uma medida de dissipação, isto é, como 
uma pequena área 4 = c;2Ã€, A, em um ponto fixo encolhe ou se expande, primeiro em duas dimensões, 


por simplicidade. Aqui, cı, = sen($,,$,), que envolve o seno das direções características, é um fator 


angular independente do tempo que leva em conta a não-ortogonalidade das direções características É 1€ É 2 da 
Equação (18.28). Se considerarmos a derivada de tempo de A e usarmos Ẹ; = Aj}, as coordenadas características, 


implicando Á£ j = AjAS,, obtemos, para a ordem mais baixa nós Ag, 


A= c1 2l AE À2AE3 + AE ALAE] = c1 2A A£ (À + Ao). (18.34) 


No limite A£ j — 0, constatamos pela Equação (18.34) que a taxa 


À 
G =A + =traço(F) = V fl, (18.35) 
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sendo f = (fı, f2) o vetor de funções de evolução de tempo da Equação (18.22b). Note que o seno independente 
de tempo do ângulo entre é, e £ cai fora da taxa. A generalização para número maior de dimensões é óbvia. Além 
do mais, em n dimensões, 


traço(F) = 3 Ai. (18.36) 


Essa fórmula de traço resulta da invariância da polinomial secular na Equação (18.29) sob uma transformação 
linear CE = x em particular, e é um resultado de sua forma de determinante usando o teorema do produto para 
determinantes (veja a Seção 3.2), a saber, 


det(F— A - 1) = [det(C)] ~" det(F — À 1) [det(C)] = det(C!(F— A- 1)C) 
det(C!FC— À- 1) = TIO: —2). (18.37) 


i=1 


Aqui, a forma de produto aparece substituindo a Equação (18.30). Agora, traço(F) é o coeficiente de (—A)"—1 pela 
expansão de det(F — À - 1) em potências de À, enquanto é 3”, A;, pela forma do produto T[;(A; — À), o que prova 
a Equação (18.36). Claramente, de acordo com as Equações (18.35) e (18.36), 


e é o sinal (e mais precisamente o traço) dos expoentes característicos da matriz de derivadas no ponto fixo que 
determina se há uma expansão ou uma redução de áreas e volumes perto de um ponto crítico quando o número 
de dimensões é maior. 

Então, resumindo, a Equação (18.35) afirma que dissipação requer V - f(y) # 0, em que y; = fj, não ocorre 

em sistemas hamiltonianos em que V - f = 0. 

Além do mais, em duas ou mais dimensões há as seguintes possibilidades globais: 

e À trajetória pode descrever uma órbita fechada (ciclo). 

e A trajetória pode se aproximar de uma órbita fechada (espiral para dentro ou para fora na direção da órbita), à 
medida que t — oo. Nesse caso, temos um ciclo limite. 


O comportamento local de uma trajetória perto de um ponto crítico também é mais variado em geral do que em 
uma dimensão. Em um ponto crítico estável, todas as trajetórias podem se aproximar do ponto crítico ao longo de 
linhas retas ou de espirais para dentro (em direção ao nó espiral) ou podem seguir um caminho mais complicado. 
Se todas as trajetórias invertidas em relação ao tempo se dirigirem ao ponto crítico em espirais quando t — —oo, 
então o ponto crítico é um ponto espiral divergente ou repulsor espiral. Quando algumas trajetórias se aproximam 
do ponto crítico enquanto outras se afastam dele, então ele é denominado ponto de sela. Quando todas as trajetórias 
formam órbitas fechadas em torno do ponto crítico, ele é denominado centro. 


Bifurcações em Sistemas Dinâmicos 


2 


Uma bifurcação é uma mudança repentina de dinâmica para valores específicos de parâmetros, tal como o 
nascimento de um par de pontos fixos repulsores ou seu desaparecimento devido ao ajuste de um parâmetro 
de controle, isto é, os movimentos antes e depois da bifurcação são topologicamente diferentes. Em um 
ponto de bifurcação, não somente as soluções são instáveis quando um ou mais parâmetros sofrem pequenas 
alterações, como também o caráter da bifurcação no espaço de fase ou na variedade do parâmetro pode 
mudar. Assim, estamos tratando com eventos bastante repentinos de dinâmica linear. Alterações repentinas 
de comportamento de trajetórias de regular para aleatório são características de bifurcações, assim como a 
dependência sensível de condições: condições iniciais próximas podem levar a comportamentos a longo termo 
muito diferente. Se uma bifurcação não sofrer mudanças qualitativas quando os parâmetros são ajustados, ela 
é denominada estruturalmente estável. Note que, na realidade, a ocorrência de bifurcações estruturalmente 
instáveis é improvável, porque ruído e outros graus de liberdade desprezados agem como perturbações sobre 
o sistema que efetivamente fazem as bifurcações instáveis desaparecerem de vista. Bifurcações (assim como 
duplicações em mapas) são importantes como uma entre muitas rotas para o caos. Outras são mudanças repentinas 
em trajetórias associadas a diversos pontos críticos denominadas bifurcações globais. Muitas vezes elas envolvem 
mudanças em bacias de atração e/ou outras estruturas globais. A teoria de bifurcações globais é razoavelmente 
complicada e hoje ainda está em seus estágios iniciais. 

Bifurcações que estão ligadas a mudanças repentinas no comportamento qualitativo de sistemas dinâmicos em 
um único ponto fixo são denominadas bifurcações locais. Mais especificamente, uma mudança na estabilidade 
ocorre em espaço de parâmetro em que a parte real de um expoente característico do ponto fixo sofre alteração de 
sinal, isto é, passa de trajetórias atratoras para repulsoras, ou vice-versa. O teorema da variedade central diz que 
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em uma bifurcação local somente interessam os graus de liberdade envolvidos com expoentes característicos que 
estão indo a zero: RA; = 0. Localizar o conjunto desses pontos é o primeiro passo em uma análise de bifurcação. 
Uma outra etapa consiste em catalogar os tipos de bifurcações em sistemas dinâmicos — é o que faremos a seguir. 

As formas normais convencionais de equações dinâmicas representam um ponto de partida para classificar 
bifurcações. Para sistemas com um só parâmetro (isto é, um distribuidor central unidimensional), escrevemos o 
caso geral de EDN, como segue: 


t=) a a te) ala! + dS aos. (18.38) 
j=0 j=0 j=0 


em que o índice superior nos a!) denota a potência do parâmetro c aos quais eles estão associados. Mapas não- 
lineares iterados unidimensionais — tais como o mapa logístico da Seção 18.2 (que ocorre em seções de Poincaré) 
— de sistemas dinâmicos não-lineares podem ser classificados de forma semelhante, a saber, 


Enp =D Pri + eS ari + 2S Pai +. (18.39) 
j=0 j=0 j=0 


Assim, uma das EDNs mais simples com uma bifurcação é 


t=- c, (18.40) 
que corresponde a todos ga = 0, exceto para as” =-—le aP = 1. Para c > 0, há dois pontos fixos (lembre-se 
de que x = 0) x+ = +yc com expoentes característicos 2x+, portanto x. é um nó e x4 é um repulsor. Para c < 0 


não há pontos fixos. Por conseguinte, à medida que c — 0, o par de pontos fixos desaparece repentinamente, isto 
é, o valor de parâmetro c = 0 é uma bifurcação de nó repulsor que é estruturalmente instável. Esse mapa complexo 
(com c — —c) gera os conjuntos de fractais de Julia e Mandelbrot discutidos na Seção 18.3. 

Uma bifurcação em garfo ocorre para o oscilador não-atenuado (caso especial e não-dissipativo do oscilador de 
Duffing) com uma anarmonia cúbica 


ï+ az + br? =0, b>0. (18.41) 


Ele tem um espectro de frequência contínuo e é, entre outros, um modelo para uma bola que bate entre duas paredes. 
Quando o parâmetro de controle a > 0, há somente um ponto fixo, em x = 0, um nó, enquanto para a < 0 há mais 
dois nós, em z+ = ++/—a/b. Assim, temos uma bifurcação em garfo de um nó na origem para um ponto de sela 
na origem e dois nós, em z+ 0. Em termos de uma formulação de potencial, V (x) = ax? /2 + bax4/4 é um poço 
único para a > 0, mas um poço duplo (com um máximo em x = 0) para a < 0. 

Quando um par de expoentes característicos complexos conjugados p + ix passa de um nó espiral (p < 0) para 
um espiral repulsor (p > 0) e surge, movimento periódico (ciclo limite), então denominamos a mudança qualitativa 
bifurcação de Hopf. Elas ocorrem na rota quase-periódica para o caos, que será discutida na próxima seção, que 
trata do caos. 

Em uma análise global reunimos os movimentos próximos a vários pontos críticos, como nós e bifurcações, 
em feixes de trajetórias que correm mais ou menos juntas em duas dimensões. (Essa visão geométrica é o 
modo corrente de analisar soluções de sistemas dinâmicos.) Mas esse fluxo deixa de ser coletivo no caso de três 
dimensões, em que divergem um do outro, em geral, porque é possível um movimento caótico que normalmente 
enche de pontos o plano de uma seção de Poincaré. 


Caos em Sistemas Dinâmicos 

Nossos resumos anteriores de aspectos intrincados e complicados de sistemas dinâmicos que se devem à não- 
linearidade em uma e duas dimensões não incluem caos, embora alguns deles, como bifurcações, às vezes são 
precursores do caos. Em EDNSs de três ou mais dimensões pode ocorrer movimento caótico, muitas vezes quando 
uma constante do movimento (uma integral de energia para EDNs definidas por uma hamiltoniana, por exemplo) 
restringe as trajetórias a um volume finito em espaço de fase e quando não há nenhum ponto crítico. Outro 
sinal característico de caos é quando para cada trajetória há trajetórias próximas, algumas das quais se afastam 
dela, enquanto outras dela se aproximam, à medida que o tempo cresce. A noção de divergência exponencial de 
trajetórias próximas torna-se quantitativa pelo expoente de Lyapunov A (veja a Seção 18.3 para mais detalhes) 
de mapas iterados de seções de Poincaré associados ao sistema dinâmico. Se duas trajetórias próximas estão a uma 
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distância do no tempo t = 0, mas divergem por uma distância d(t) em um tempo posterior t, então d(t) = doe" 
é válido. Assim, analisando a série de pontos, isto é, mapas iterados gerados em seções de Poincaré, podemos 
estudar rotas para o caos de sistemas dinâmicos tridimensionais. Esse é o método fundamental para estudar caos. 
À medida que variamos a localização e a orientação do plano de Poincaré, muitas vezes percebemos que um ponto 
fixo sobre esse plano se origina de um ciclo limite no espaço de fase tridimensional cuja estabilidade estrutural 
pode ser ali verificada. Por exemplo, ciclos limites atratores aparecem como nós em seções de Poincaré, ciclos 
limites repulsores aparecem como repulsores de mapas de Poincaré e ciclos de sela aparecem como pontos de sela 
de mapas de Poincaré associados. 

É preciso três ou mais dimensões de espaço de fase para ocorrer caos por causa da influência recíproca das 
condições necessárias que acabamos de discutir, a saber, 


e trajetórias limitadas (são costumeiras em sistemas hamiltonianos), 

e divergência exponencial de trajetórias próximas (é garantida por expoentes de Lyapunov positivos de mapas de 
Poincaré correspondentes), 

e nenhuma interseção de trajetórias. 


A última condição é obedecida por sistemas determinísticos em particular, como discutimos na Seção 18.1. Um 
aspecto surpreendente do caos, mencionado na Seção 18.1, é sua predominância e quão universais as rotas para o 
caos muitas vezes são, a despeito da esmagadora variedade de EDNs. 

Um exemplo para padrões espacialmente complexos em Mecânica Clássica é o pêndulo planar, cuja equação 
unidimensional de movimento 


dê dL 
I 


m L, u —lmgsen 0 (18.42) 


é não-linear na variável dinâmica 0(t). Aqui, 1 é o momento de inércia, | é a distância até o centro de massa, 
m é a massa e g é a constante de aceleração gravitacional. Quando todos os parâmetros na Equação (18.42) são 
constantes no tempo e no espaço, então as soluções são dadas em termos de integrais elípticas (veja a Seção 5.8) e 
não existe caos. Contudo, um pêndulo sob uma força periódica externa pode exibir dinâmica caótica, por exemplo, 
para o lagrangiano 


L= TP mg(l— z), (£ — r0)? +y +2 =, (18.43) 
zo = El cos wt. (18.44) 
em que (Veja Moon (1992) nas Leituras Adicionais.) 
Bons candidatos para caos são problemas de potencial de poço múltiplo, 
dr dr 
2 = F|r,—,t 18.4 
JE +VV(r) (e TE | (18.45) 


F representa forças dissipativas e/ou forças propulsoras. Outro exemplo clássico é a rotação de um corpo rígido, 
cujas equações tridimensionais não-lineares de Euler são familiares, a saber, 


d 
— hw = (h — I3)w2w3 + Mı, 


dt 

d 

ge”? = (13 = I)wws E À Mo, (18.46) 
d 

q SUS = (L =s h)jwiw2 leo Ms. 


Aqui, os 1; são os principais momentos de inércia e w é a velocidade angular com componentes wj em torno 
dos eixos principais do corpo fixo. Até mesmo a rotação de um corpo rígido livre pode ser caótica porque seus 
acoplamentos não-lineares e forma tridimensional satisfazem todos os requisitos para ocorrência do caos (veja a 
Seção 18.1). Um exemplo de caos de corpo rígido em nosso sistema solar são as cambalhotas caóticas de Hyperion, 
uma das luas de Saturno, cuja forma é muito pouco esférica. É um mundo onde o nascer e o pôr de Saturno 
é tão irregular a ponto de ser imprevisível. Outro exemplo é o cometa de Halley, cuja órbita é perturbada por 
Júpiter e Saturno. Em geral, quando três ou mais corpos celestiais interagem sob as forças da gravidade, dinâmicas 
estocásticas são possíveis. Entretanto, note que é preciso simulações por computador em grandes intervalos de 
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tempo para averiguar a dinâmica caótica no sistema solar. Se quiser mais detalhes sobre caos em tais sistemas 
hamiltonianos conservativos, consulte o Capítulo 8 de Hilborn (1994) nas Leituras Adicionais. 


Exercício 


18.4.3 Construa um mapa de Poincaré para o oscilador de Duffing na Equação (18.41). 


Rotas para o Caos em Sistemas Dinâmicos 


Agora vamos examinar algumas rotas para o caos. A rota para o caos de duplicação de período é exemplificada 
pelo mapa logístico na Seção 18.2, e os números universais œ, ô de Feigenbaum são seus aspectos quantitativos, 
juntamente com expoentes de Lyapunov. É comum em sistemas dinâmicos. Pode começar com movimento 
(periódico) de ciclo limite que aparece como um ponto fixo em uma seção de Poincaré. O ciclo limite pode 
ter-se originado em uma bifurcação de um nó ou de algum outro ponto fixo. À medida que um parâmetro de 
controle muda, o ponto fixo do mapa de Poincaré se subdivide em dois pontos, isto é, o ciclo limite tem um 
expoente característico que passa por zero, de atrator a repulsor, por exemplo. Agora, o movimento periódico tem 
um período duas vezes mais longo do que antes, etc. Referimo-nos ao Capítulo 11 de Barger e Olsson (1995) 
nas Leituras Adicionais para gráficos de duplicação de período de seções de Poincaré para a equação de Duffing 
(18.41) com uma força externa periódica. Outro exemplo para a duplicação de período é um oscilador forçado com 
atrito (veja Helleman em Cvitanovic (1989) nas Leituras Adicionais). 

A rota quase-periódica para o caos também é bastante comum em sistemas dinâmicos, por exemplo, começando 
em um nó independente, um ponto fixo. Se ajustarmos um parâmetro de controle, o sistema sofre uma bifurcação de 
Hopf para o movimento periódico correspondente a um ciclo limite em espaço de fase. Continuando a mudança do 
parâmetro de controle, aparece uma segunda freqiiência. Se a razão entre as frequências for um número irracional, 
as trajetórias são quase-periódicas, e mais cedo ou mais tarde cobrirão a superfície de um toro em um espaço 
de fase, isto é, órbitas quase-periódicas nunca fecham nem se repetem. Mais mudanças no parâmetro de controle 
podem levar a uma terceira frequência ou diretamente a movimento caótico. Faixas de movimento caótico podem 
se alternar com movimento quase-periódico em espaço de parâmetro. Um exemplo para tal sistema dinâmico é um 
pêndulo periodicamente forçado. 

Uma terceira rota para o caos passa pela intermitência, na qual o sistema dinâmico se alterna entre dois 
movimentos qualitativamente diferentes em parâmetros de controle fixos. Por exemplo, no início, o movimento 
periódico se alterna com uma rajada ocasional de movimento caótico. Com uma mudança no parâmetro de controle 
as rajadas caóticas se alongam até que, mais cedo ou mais tarde, não resta nenhum movimento periódico. As partes 
caóticas são irregulares e não se parecem umas com as outras, mas precisamos verificar se há um expoente de 
Lyapunov positivo para demonstrar caos. Intermitências de vários tipos são aspectos comuns de estados turbulentos 
em dinâmica dos fluidos. As EDNs acopladas de Lorenz também mostram intermitência. 


Exercício 


18.4.4 Monte um gráfico para a região de intermitência do mapa logístico em u = 3,8319. Qual é o período 
dos ciclos? O que acontece em u = 1 + 2V2? 


Resposta: Há uma bifurcação tangente para ciclos de período 3. 
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19 
Probabilidade 


Probabilidades surgem em muitos problemas que tratam de eventos aleatórios ou grande número de partículas que 
definem variáveis aleatórias. Um evento é denominado aleatório se ele for praticamente impossível de prever a 
partir do estado inicial. Isso inclui os casos em que temos apenas informações incompletas sobre estados iniciais 
e/ou dinâmica, como em Mecânica Estatística, quando podemos não saber a energia do sistema que corresponde a 
muitas configurações microscópicas possíveis, o que nos impede de prever resultados individuais. Muitas vezes, as 
propriedades médias de muitos eventos similares são previsíveis, como em teoria quântica. É por isso que a teoria 
da probabilidade pode ser e é desenvolvida. 

Variáveis aleatórias estão envolvidas quando dados dependem do acaso, como a previsão do tempo e o preço de 
ações. A teoria da probabilidade descreve modelos matemáticos de processos fortuitos em termos de distribuições 
de probabilidade de variáveis aleatórias que descrevem como alguns “eventos aleatórios” são mais prováveis 
que outros. Nesse sentido a probabilidade é uma medida de nossa ignorância e dá significado quantitativo a 
afirmações qualitativas tais como: “É provável que chova amanhã”. “É improvável que eu tire a rainha de copas. 
“Probabilidades são de fundamental importância em Mecânica Quântica e Mecânica Estatística e são aplicadas em 
Meteorologia, Economia, jogos e muitas outras áreas da vida diária. 

Para um matemático, probabilidades são baseadas em axiomas, mas aqui discutiremos modos práticos de 
calcular probabilidades para eventos aleatórios. Como os experimentos em ciências estão sempre sujeitos a erros, 
as teorias de erros e sua propagação envolvem probabilidades. Em Estatística tratamos com aplicações da teoria da 
probabilidade a dados experimentais. 


19.1 Definições, Propriedades Simples 


Todos os resultados possíveis mutuamente exclusivos! de um experimento que está sujeito ao acaso representam 
eventos (ou pontos) do espaço amostral S. Por exemplo, cada vez que lançamos uma moeda, damos à tentativa um 
número à = 1,2,... e observamos os resultados x;. Aqui, a amostra consiste em dois eventos: cara ou coroa, e os 
x; representam uma variável aleatória discreta que assume um dos dois valores cara ou coroa. Quando são lançadas 
duas moedas, a amostra contém os eventos duas caras, uma cara e uma coroa, duas coroas; o número de caras é 
um bom valor para atribuir à variável aleatória portanto, os valores possíveis são 2, 1 e O. Há quatro resultados 
igualmente prováveis, dos quais um tem valor 2, dois têm valor 1, e um tem valor O. Portanto, as probabilidades 
dos três valores da variável aleatória são 1/4 para duas caras (valor 2), 1/4 para nenhuma cara (valor 0) e 1/2 para 
valor 1. Em outras palavras, definimos a probabilidade teórica P de um evento denotado pelo ponto x; da amostra 
como 
_ número de resultados do evento x; 


P(x;) = g 19.1 
(2:) número total de todos os eventos ( ) 


Uma definição experimental se aplica quando o número total de eventos não é bem definido (ou é difícil de obter) 
ou nem sempre ocorrem resultados igualmente prováveis. Então, 


po número de vezes que o evento x; ocorre (19.2) 
zti) = - À 
É número total de tentativas 


é mais apropriada. Uma pilha grande, totalmente misturada de grãos de areia brancos e pretos do mesmo tamanho e 
em iguais proporções, é um exemplo relevante porque não é prático contar todos eles. Mas podemos contar os grãos 
de um pequeno volume que escolhermos como amostra. Desse modo, podemos verificar que grãos brancos e pretos 


"Isso significa que, dado que um evento particular ocorreu, os outros não poderiam ter ocorrido. 
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aparecem com aproximadamente a mesma probabilidade 1/2, contanto que devolvamos cada amostra à pilha e a 
misturemos novamente. Constata-se que, quanto maior o volume da amostra, menor será o desvio em relação 1/2. 
Quanto mais tentativas fizermos, mais próxima de 1/2 estará a média de ocorrências de todas as contagens obtidas 
nas tentativas. Poderíamos até pegar grãos individuais e verificar se a probabilidade 1/4 de pegar dois grãos pretos 
em seguida é igual à probabilidade de pegar dois grãos brancos em seguida, etc. Há inúmeras questões estatísticas 
que podemos estudar. Assim, pilhas de areia colorida nos proporcionaram experimentos instrutivos. 
Os seguintes axiomas são evidentes por si sós: 
e Probabilidades satisfazem O < P < 1. Probabilidade 1 significa certeza; probabilidade O significa 
impossibilidade. 
e À amostra inteira tem probabilidade 1. Por exemplo, tirar uma carta de baralho arbitrária tem probabilidade 1. 
e As probabilidades para eventos mutuamente exclusivos se somam. A probabilidade de conseguir uma cara em 
dois lançamentos de moeda é 1/4+ 1/4 = 1/2 porque ela é 1/4 para o evento cara primeiro e em seguida coroa, 
mais 1/4 para o evento coroa antes e depois cara. 


Exemplo 19.1.1 PROBABILIDADE PARA Á OU B 


Qual é a probabilidade de tirar? uma carta de paus ou um valete de um baralho? Como há 52 cartas em um 
baralho, cada uma delas é igualmente provável, 13 cartas de cada naipe e 4 valetes, há 13 cartas de paus 
incluindo o valete de paus e mais 3 outros valetes; isto é, há 16 cartas possíveis em 52, o que dá a probabilidade 
(13 + 3)/52 = 16/52 = 4/13. E 

Se representarmos o espaço amostral por um conjunto S de pontos, então eventos são subconjuntos 4, B,... 
de S, denotados como 4 C S, etc. Dois conjuntos 4, B são iguais se A estiver contido em B, A C Be B estiver 
contido em 4, B C A. A união AU B consiste em todos os pontos (eventos) que estão em 4 ou B ou ambos 
(veja a Figura 19.1). A interseção AN B consiste em todos os pontos que estão em ambos, A e B. Se A e B não 
tiverem pontos comuns, sua interseção é o conjunto vazio, AN B = (), que não tem nenhum elemento (evento). 
O conjunto de pontos em A que não estão na interseção de A e B é denotado por A — A N B, definindo uma 
subtração de conjuntos. Se considerarmos o naipe de paus no Exemplo 19.1.1 como conjunto A e os 4 valetes 
como conjunto B, então sua união compreende todas as cartas de paus e valetes e sua interseção é somente o valete 
de paus. 


Figura 19.1: A área sombreada dá a interseção AN B, correspondente aos eventos A e B; a linha tracejada encerra 
AU B, correspondente aos eventos 4 ou B. 


Cada subconjunto A tem sua probabilidade P(A) > 0. Em termos desses conceitos e notações da teoria dos 
conjuntos, as leis da probabilidade que acabamos de discutir se tornam 


0<P(A)<1 


O espaço amostral inteiro tem P(S) = 1. A probabilidade da união AU B de eventos mutuamente exclusivos é a 
soma 


P(AU B) = P(A) + P(B), ANB =. 


A regra da adição para probabilidades de conjuntos arbitrários é dada pelo seguinte teorema: 


2Esses são exemplos de eventos não-mutuamente exclusivos. 
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REGRA DA ADIÇÃO: 


P(AUB) = P(A) + P(B) — P(AN B). (19.3) 


Para provar isso, decompomos a união em dois conjuntos mutuamente exclusivos AU B = AU (B —- BN A), 
subtraindo a interseção de A e B de B antes de uni-los. Suas probabilidades são P(A), P(B) — P(BNA), as quais 
somamos. Também poderíamos ter decomposto AU B = (A— AN B)U B, da qual resulta nosso teorema, de modo 
semelhante, somando essas probabilidades, P(AU B) = [P(A) — P(AN B)|+ P(B). Note que AN B = BAA. 
(Veja a Figura 19.1.) 

Entretanto, às vezes, as regras e definições de probabilidades que discutimos até aqui não são suficientes. 


Exemplo 19.1.2 PROBABILIDADE CONDICIONAL 

Um exemplo simples consiste em uma caixa de 10 canetas idênticas vermelhas e 20 canetas idênticas azuis, 
arranjadas em ordem aleatória, da qual retiramos canetas sucessivamente, isto é, sem devolvê-las à caixa. Suponha 
que tiramos primeiro uma caneta vermelha, evento A. Isso acontecerá com probabilidade A. P(A) = 10/30 = 1/3 
se as canetas estiverem totalmente misturadas. Contudo, a probabilidade condicional P(B|A) de tirar uma caneta 
azul na próxima rodada, evento B, dependerá do fato de termos tirado uma caneta vermelha na primeira rodada. 
Ela é dada por 20/29. Há 10-20 possíveis pontos amostrais (eventos vermelhos/azuis) em duas rodadas, e a amostra 
tem 30 - 29 eventos; portanto, a probabilidade combinada é 


102 10.2 2 
P(A,B) = 0 0 0 0 0 
3029 30-29 87 
E 
Em geral, a probabilidade combinada P(A, B) de acontecer A e B (nessa ordem) é dada pelo produto entre a 
probabilidade de A acontecer, P(A), e a probabilidade de B acontecer se A acontecer, P(B|A): 


P(A, B) = P(A)P(BIA). (19.4) 
Em outras palavras, a probabilidade condicional P(B|A) é dada pela razão 


P(A,B) 


PM = 


(19.5) 
Se a probabilidade condicional P(B|A) = P(B) for independente de 4, então os eventos A e B são denominados 
independentes, e a probabilidade combinada 


P(ANB) = P(A)P(B) (19.6) 
é simplesmente o produto de ambas as probabilidades. 


Exemplo 19.1.3 TESTES DE APTIDÃO ESCOLAR 

Faculdades e universidades confiam nas pontuações alcançadas em habilidades verbais e matemáticas em testes 
SAT (Scholastic Aptitude Tests — Testes de Aptidão Escolar), entre outros, para prever se um aluno passará em seus 
cursos e se formará. Sabe-se que uma universidade de pesquisa admite principalmente estudantes que alcancem 
pontuações combinadas em habilidades verbais e matemáticas acima de 1.400 pontos. A taxa de conclusão de 
cursos é de 95%, isto é, 5% desistem ou se transferem para outra escola. Entre os que se formam, 97% têm uma 
pontuação SAT maior do que 1.400 pontos, enquanto 80% entre os que desistem têm pontuação SAT abaixo de 
1.400. Suponha que um estudante tenha uma nota SAT abaixo de 1.400. Qual é sua possibilidade de concluir o 
curso? 

Seja A os casos que têm pontuação SAT abaixo de 1.400, B representa os que têm acima de 1.400, eventos 
mutuamente exclusivos com P(A) + P(B) = 1, e C os estudantes que se formam. Isto é, queremos saber as 
probabilidades condicionais P(C|A) e P(C|B). Para aplicar a Equação (19.5), precisamos de P(A) e P(B). Há 
3% dos estudantes com pontuação abaixo de 1.400 entre os que se formam (95%) e 80% dos 5% que não se 
formam, portanto, 


0,05 


4 
P(A) =0,03-0,95+ 20,05 = 0,0685, P(B) = 0,97 -0,95 + = 0,9315, 
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e também 
P(C N A) =0,03-0,95 = 0,0285 e P(C N B) = 0,97 - 0,95 = 0, 9215. 


Aqui, as probabilidades combinadas P(C, A) = P(C N A), P(C, B) = P(C A B), já que C e A (e C e B) são 
partes do mesmo espaço amostral. Por conseguinte, 


P(CAA) 0,0285 
P(A) 0,0685 
P(CAB) 0,9215 
P(B) 0,9315 


P(CIA) = ~ 41, 6%, 


~ 98, 9%, 


P(CIB) = 


O 


isto é, a probabilidade de um estudante com menos de 1.400 pontos se formar nessa universidade em particular 
um pouco menor que 42%. 


Como um corolário da definição de uma probabilidade condicional, Equação (19.5), comparamos P(A|B) = 
P(ANB)/P(B) e P(B|A) = P(AN B)/P(A), que leva ao seguinte teorema. 


TEOREMA DE BAYES: 


P(A|B) = BE P(BIA). (19.7) 


Essa expressão pode ser generalizada para o seguinte. 


TEOREMA: Se os eventos aleatórios A; com probabilidades P(A;) > O forem mutuamente exclusivos e sua 
união representar a amostra inteira S, então um evento aleatório arbitrário B C S tem a probabilidade 


P(B) = SE PA) P(BIA). (19.8) 


i=l 


Essa lei de decomposição lembra a expansão de um vetor em uma base de vetores unitários que definem as 
componentes do vetor. Essa relação resulta da óbvia decomposição B = |J; (B N A;), Figura 19.2, que implica 
P(B) = 53, P(B N A;) para as probabilidades porque as componentes B N A; são mutuamente exclusivas. Para 
cada i, sabemos pela Equação (19.5) que P(B N A;) = P(A;)P(B|A;), o que prova o teorema. 


Contagem de Permutações e Combinações 
Contar partículas em amostras pode nos ajudar a achar probabilidades, como na Mecânica Estatística. 

Se tivermos n moléculas diferentes, vamos perguntar de quantos modos podemos arranjá-las em uma fila, isto 
é, permutá-las. Esse número é definido como o número de suas permutações. Assim, por definição, a ordem 
importa nas permutações. Há n chances de pegar a primeira molécula, n — 1 de pegar a segunda, etc. No total há 


n! permutações de n moléculas ou objetos diferentes. 


Figura 19.2: A área sombreada B é composta de subconjuntos mutuamente exclusivos de B que pertencem também 
a Ay, Ao, As, em que os A; são mutuamente exclusivos. 
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Generalizando isso, suponha que haja n pessoas mas somente k < n cadeiras para acomodá-las. De quantas 
maneiras podemos sentar k pessoas nas cadeiras? Contando como antes, obtemos 


n(n—-D(n-k+D=—— 
(n-k)! 
para o número de permutações de n objetos diferentes, k por vez. 

Agora consideramos o número de combinações de objetos quando sua ordem é irrelevante por definição. 
Por exemplo, três letras a, b, c podem ser combinadas duas letras por vez, de 3 = 3 modos: ab, ac, bc. Se as 
letras puderem ser repetidas, então adicionamos os pares a aa, bb, cc e teremos seis combinações. Assim, uma 
combinação de partículas diferentes é diferente de uma permutação no sentido de que sua ordem não importa. 
Combinações ocorrem com repetição (o modo que o matemático tem para tratar objetos indistinguíveis) e sem 
repetição, quando não há dois conjuntos que contenham as mesmas partículas. 

O número de diferentes combinações de n partículas, n partículas, k por vez e sem repetições é dado pelo 
coeficiente binomial 


LE id a (0). 


pe 


No número n!/(n — k)! de permutações de n partículas, k por vez, temos de dividir pelo número k! de permutações 
dos grupos de k partículas porque sua ordem não importa em uma combinação. Isso prova nossa primeira 
afirmação. A segunda é demonstrada por indução matemática. 

Em Mecânica Estatística, perguntamos de quantos modos podemos colocar n partículas dentro de k caixas, 
de modo que haja n; partículas (distinguíveis) na i-ésima caixa, sem considerar a ordem em cada caixa, com 


Se for permitida a repetição, o número é 


35;=1 ni = n. Contando como antes, há n chances de selecionar a primeira partícula, n — 1 para pegar a segunda, 
etc., mas as nı! permutações dentro da primeira caixa são descontadas e n2! permutações dentro da segunda caixa 
são desconsideradas, etc. Portanto, o número de combinações é 


| 

o ih E HA o ec Ne= M: 

1:19: ngk: 
Em Mecânica Estatística, partículas que obedecem à estatística de: 
e Maxwell-Boltzmann (MB) são distinguíveis, sem restrição a seu número em cada estado; 
e Bose-Einstein (BE) são indistinguíveis, sem nenhuma restrição ao número de partículas em cada estado 

quântico; 
e Fermi-Dirac (FD) são indistinguíveis, com no máximo uma partícula por estado. 
Por exemplo, colocando essas três partículas em quatro caixas, há 4º arranjos igualmente possíveis para o caso 
MB, porque cada partícula pode ser colocada em qualquer caixa de quatro modos, o que dá um total de 4º chances. 
Para a estatística BE, o número de combinações com repetições é (o) = ($) para o caso Bose-Einstein. Para 
a estatística FD, é (Fr) = (5): De modo mais geral, para estatística MB o número de arranjos distintos de n 

TT) 
n 


partículas entre k estados (caixas) é k” , para estatística BE é ( e para estatística FD é E): 


Exercícios 


19.1.1 Uma carta é retirada de um baralho embaralhado. (a) Qual é a probabilidade de ela ser preta, (b) um 
nove vermelho ou (c) uma rainha de espadas? 


19.1.2 Ache a probabilidade de tirar dois reis de um baralho embaralhado (a) se a primeira carta for 
devolvida ao baralho antes de tirar a segunda, e (b) se a primeira carta não for devolvida ao baralho 
após ser tirada. 


19.1.3 Quando são jogados dois dados, qual é a probabilidade de (a) sair um número menor do que 4 ou 
(b) um número maior ou igual a 4, porém menor do que 6? 


19.1.4 Jogando três dados não-viciados, qual é a probabilidade de obter seis pontos? 
19.1.5 Determine a probabilidade P(A N B N C') em termos de P(A), P(B), P(C) etc. 
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19.1.6 Determine diretamente ou por indução matemática a probabilidade de uma distribuição de N 
partículas (Maxwell-Boltzmann) em k caixas com N; na caixa 1, Nə na caixa 2,..., Ny na k- 
ésima caixa para quaisquer números N; > 1, com Ny + No +: + Nk = N, k < N. Repita essa 
mesma operação para partículas de Fermi-Dirac e de Bose-Einstein. 


19.1.7 — Mostre que 
P(AUBUC) = P(A) +P(B)+P(C) —- P(ANB)- P(ANC)—- P(BNC)+ P(ANBNO). 


19.1.8 Determine a probabilidade de um inteiro positivo n < 100 ser divisível por um número primo 
p < 100. Verifique seu resultado para p = 3,5, 7. 


19.1.9 Ponha duas partículas que obedecem à estatística de Maxwell-Boltzmann (Fermi-Dirac ou Bose— 
Einstein) em três caixas. Há quantos modos em cada caso? 


19.2 Variáveis Aleatórias 

Cada vez que lançamos um dado, damos à tentativa um número à = 1,2,...e observamos o ponto x; = 1 ou 2, 3, 
4, 5, 6, com probabilidade 1/6. Se à denotar o número da tentativa, então x; é uma variável aleatória discreta que 
assume valores discretos de 1 a 6, com uma probabilidade definida P(x;) = 1/6. 


Exemplo 19.2.1 VARIÁVEL ALEATÓRIA DISCRETA 

Se lançarmos dois dados e registrarmos a soma dos pontos mostrada em cada tentativa, então esta soma 
também é uma variável aleatória discreta, que assume o valor 2 quando ambos os dados mostram 1 com 
probabilidade (1/6)2; o valor 3, quando um dado tem 1 e o outro 2, por conseguinte, com probabilidade 
(1/6)? + (1/6)? = 1/18; o valor 4, quando ambos os dados têm 2 ou um deles tem 1 e o outro 3, portanto, com 
probabilidade (1/6)? + (1/6)? + (1/6)? = 1/12; o valor 5, com probabilidade 4(1/6)2 = 1/9; o valor 6, com 
probabilidade 5/36; o valor 7, com a probabilidade máxima, 6(1/6)? = 1/6; até o valor 12, quando ambos os 
dados mostram 6, pontos com probabilidade (1/6)2. Essa distribuição de probabilidade é simétrica em torno de 7. 
Essa simetria é óbvia pela Figura 19.3 e se torna visível em termos algébricos quando escrevemos as partes lineares 
ascendentes e descendentes como 


Pæ) 
4 


Figura 19.3: Distribuição de probabilidade P(x) da soma de pontos quando são lançados dois dados. 


qdo oS (Tt) 


(x) 36 36 2 x b) À 2 ? 
13-27 6+(7—-2) 
(x) 36 36 , T 7,8, 2 


: E 
Então, resumindo: 


e Os diferentes valores x; que uma variável aleatória X assume denotam e distinguem os eventos no espaço 
amostral de um experimento; cada evento ocorre por acaso com a probabilidade P(X = x;) = p; > 0, que é 
uma função da variável aleatória X. Uma variável aleatória X (e;) = x; é definida no espaço amostral, isto é, 
para os eventos e; € S. 
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e Definimos a densidade de probabilidade f(x) de uma variável aleatória contínua X como 
P(x < X < x+ dz) = f(x)da, (19.9) 


isto é, f(x) dx é a probabilidade de X se encontrar no intervalo x < X < x + dz. Para f(x) ser uma densidade 
de probabilidade, ela tem de satisfazer f(x) > 0e f f(x)dx = 1. A generalização para distribuições de 
probabilidade que dependem de diversas variáveis aleatórias é direta. Há inúmeros exemplos na Física Quântica. 


Exemplo 19.2.2 VARIÁVEL ALEATÓRIA CONTÍNUA: ÁTOMO DE HIDROGÊNIO 
A Mecânica Quântica dá a probabilidade |4|? d?r de encontrar um elétron 1s em um átomo de hidrogênio em 
volume? d?r, em que Y = Ne™”/® é a função de onda que é normalizada para 
1= l|? dV = sn? | ear dr = maè N?, dV = r°? dr dcos 0 dy, 
0 


sendo o elemento de volume e a o raio de Bohr. Achamos a integral radial por integração repetida por partes ou 
elevando-a para a função gama 


a AN Te a a? 
f ela? dr = (5) f e fx? dz = T6) q 


Aqui, todos os pontos no espaço constituem a amostra e representam três variáveis aleatórias, mas a densidade de 
probabilidade ||? nesse caso depende somente da variável radial por causa da simetria esférica do estado 1s. 

Uma medida para o tamanho do átomo H é dada pela distância radial média entre o elétron e o próton no centro, 
o que em Mecânica Quântica é denominado valor esperado: 


(Lslr[1s) = folvptav = ama? | re /“p2 dr = Ža, 
0 


Em breve definiremos esse conceito para distribuições de probabilidade arbitrárias. E 
e Uma variável aleatória que assume somente valores discretos £1, £2, ..., £n com probabilidades p1, p2,...,Pn, 
respectivamente, é denominada variável aleatória discreta, portanto *_; p; = 1. Se um “experimento” ou 


tentativa for realizada, algum resultado deve ocorrer, com probabilidade unitária. 
e Se os valores compreenderem uma faixa contínua de valores a < x < b, então estamos tratando com uma 
variável aleatória contínua, cuja distribuição de probabilidade pode ser ou não uma função também contínua. 


Quando medimos uma quantidade x n vezes, obtendo os valores x;, definimos o valor médio 


T= 


Sim 


352; (19.10) 
j=1 


das tentativas, também denominado média ou valor esperado. Essa fórmula admite que cada valor observado 
x; é igualmente provável e ocorre com probabilidade 1/n. Essa conexão é a ligação fundamental entre dados 
experimentais e a teoria da probabilidade. Essa observação e a experiência prática sugerem definir o valor médio 
para uma variável aleatória discreta X como 


(O) => mpi (19.11) 
e para uma variável aleatória contínua caracterizada por densidade de probabilidade f(x) como 
(X) = fero da. (19.12) 


Essas médias são lineares. Outras notações existentes na literatura são X e E(X). 

A utilização da média aritmética z de n medidas como o valor médio é sugerida pela simplicidade e pura 
experiência, admitindo, mais uma vez, igual probabilidade para cada x;. Mas por que não consideramos a média 
geométrica 


Tg = (mexo Tn)” (19.13) 


Note que |Y|?4rr? dr dá a probabilidade para o elétron ser encontrado entre r e r + dr, em qualquer ângulo. 
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ou a média harmônica x, determinada pela relação 


1 1/1 1 1 
E ( di tet) (19.14) 


Th n \ Ti Tı Tn 


ou aquele valor % que minimiza a soma dos desvios absolutos |x; — %|? Aqui, considera-se que os x; aumentam 

f 7 5 2n+1 : 
monotonicamente. Quando construímos um gráfico de O(x) = 35/27! |æ; — «|, como na Figura 19.4a, para 
um número ímpar de pontos, percebemos que ele tem um mínimo em seu valor central, ¿ = n, enquanto 
4 2n P “= i 
para um número par de pontos E(x) = 31, |x; — x| é plano em sua região central, como mostra a Figura 19.4b. 
Essas propriedades tornam essas funções inaceitáveis para determinar valores médios. Em vez disso, minimizamos 
a soma dos quadrados dos desvios, 


Xi Xə X3 Xı Xo Xa Xy 


(a) (b) 


Figura 19.4: (a) TA |x; — x| para um número ímpar de pontos; (b) Da |x; — z| para um número par de pontos. 


> (a — «;)? = mínimo, (19.15) 


i=1 


e igualando a derivada a zero temos 23 (x — x;) = 0, ou 


1 e 
Es Li = E, 
n = 
KA 


isto é, a média aritmética. Ela tem outra propriedade importante: se denotarmos os desvios por v; = x; — T, 
então, 5, v; = 0, isto é, a soma dos desvios positivos é igual à soma dos desvios negativos. Esse princípio da 
minimização da soma dos desvios ao quadrado, denominado método dos mínimos quadrados, se deve a C. F. 
Gauss, entre outros. 

O grau de proximidade entre o ajuste de um conjunto de pontos de dados e o valor médio depende da dispersão 
das medidas individuais em relação a essa média. Novamente, rejeitamos a soma dos desvios >“, |£; — Z|/n 
como uma medida da dispersão porque ela seleciona a medida central como o melhor valor sem nenhuma boa 
razão. Uma definição mais apropriada da dispersão é a média dos desvios em relação à média, ao quadrado, ou 
desvio padrão 


em que a raiz quadrada é motivada por análise dimensional. 
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Exemplo 19.2.3 DESVIO PADRÃO DE MEDIDAS 


Das medidas zı = 7, z2 = 9, z3 = 10, x4 = 11, z5 = 13, extraímos z = 10 para o valor médio e 
o = v(9+1+1+9)/4 = 2,2361 para o desvio padrão, ou dispersão, usando a fórmula experimental (19.2) 
porque as probabilidades não são conhecidas. E 


Há ainda outra interpretação da variação padrão, em termos da soma dos quadrados das diferenças de medidas 


i<k i=1 k=1 
= TOn? (a?) — 2n? (x}°) = nºo?, (19.16) 


porque multiplicando o quadrado na definição de o2, obtemos 


2-1 (mo (0) = 15002 - 2 S a (o? 


KA 


= DE “(62 = (2?) — {2}. (19.17) 


Essa fórmula é frequentemente usada e amplamente aplicada para o. 


Agora estamos prontos para generalizar a dispersão em um conjunto de n medições com igual probabilidade 
1/n para a variância de uma distribuição de probabilidade arbitrária. Para uma variável aleatória discreta X com 
probabilidades p; em X = x;, definimos a variância 


2 =X (z; — (X)) p3, (19.18) 
j 


e, de modo semelhante, para uma distribuição de probabilidade contínua 


a (x —(X)) f(x) dz. (19.19) 


Essas definições implicam o seguinte. 
TEOREMA: Se uma variável aleatória Y = aX + b estiver linearmente relacionada com X, então podemos 
derivar imediatamente o valor médio (Y) = a(X) + b e a variância o2(Y) = a?o? (X) dessas definições. 
Provamos esse teorema somente para uma distribuição contínua e deixamos o caso de uma variável aleatória 
discreta como exercício para o leitor. Para a probabilidade infinitesimal, sabemos que f(x) dz = g(y) dy com 
y = ax + b, porque a transformação linear tem de preservar a probabilidade, portanto 


w= f" uoydy= [ (ar +b)Hodr=0(0)+6, 


—00 


uma vez que f f(x)dx = 1. De modo semelhante, obtemos para a variância 


“= [ “sda J Teria 0) a de 


— 00 — 00 


= 04X), 


após substituir nosso resultado pelo valor médio (Y). 
Finalmente, provamos a desigualdade geral de Chebychev 


P(|x — (X)| > ko) < a (19.20) 


que demonstra por que o desvio padrão serve como uma medida da dispersão de uma distribuição de probabilidade 
arbitrária em relação a seu valor médio (X} e mostra por que dados experimentais ou outros dados costumam ser 
caracterizados conforme sua dispersão por números de desvio padrão. Primeiro mostramos a desigualdade mais 
simples 

(Y) 


P(Y > K) < == 
K 
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para uma variável aleatória contínua Y cujos valores y > 0. (A prova para uma variável aleatória discreta segue 
linhas semelhantes.) Essa desigualdade resulta de 


oo K o0 
v-f uftu)du= [ uftu)du+ | uf(y) dy 


> [Culwavzk [O rudy= KPY =) 


Em seguida, aplicamos o mesmo método à integral positiva de variância 


o= [ œ- (X) ode f (2 — (X)) f(x) de 
lz—(X)|2ko 
> to? | Fx) de = ko? P(|x — (X)| > ko), 
le—(X)|2ko 


decrescendo em primeiro lugar o lado direito, omitindo a parte da integral positiva com |x — (X)| < ko e 
então substituindo novamente (x — (X))2 na integral remanescente por seu limite mais baixo, k2o2. Isso prova a 
desigualdade de Chebychev. Para k = 3, temos a estimativa convencional de três desvios padrão 


1 
P(|x -— (X)| > 30) < 5 (19.21) 
A generalização do valor médio para momentos mais altos de distribuições de probabilidade em relação ao valor 
médio (X) é direta: 

(X-(X) => (z; —(X)ºp;, distribuição discreta, (19.22) 

j 

((X-(X)) s5 = J; (x — (X)) E (a) de, distribuição contínua. 
A função geradora de momento j 


tXN — ta E t? 2 gear 
fe e!” f(x) da +00) + 56X) + (19.23) 


é uma soma ponderada dos momentos da variável aleatória contínua X com a substituição da expansão de Taylor 
d(etX ) 


das funções exponenciais. Assim, (X) = “z | ao 


Note que, aqui, os momentos não são relativos a seu valor 
esperado; eles são denominados momentos centrais. O enésimo momento central, (X”) = m em é dado 
pela derivada de enésima ordem da função geradora de momento em t = 0. Por uma mudança do parâmetro 
t — it, a função geradora de momento é relacionada com a função característica (e *), que é a freqiientemente 
utilizada transformada de Fourier da densidade de probabilidade f(x). 

Além do mais, valores médios, momentos e variância podem ser definidos de modo semelhante para 
distribuições de probabilidade que dependem de diversas variáveis aleatórias. Por simplicidade, vamos restringir 
nossa atenção a duas variáveis contínuas aleatórias X, Y e apresentar uma lista das quantidades correspondentes: 


=f f" attoodray 

maf: I> yf (x,y) de dy, (19.24) 
o?(X) = i f e- (ON f (æ, y) de dy, 
o? (Y) feto f_o- (1) f(x,y) da dy. (19.25) 


Diz-se que duas variáveis aleatórias são independentes se a densidade de probabilidade f(x, y) é fatorada 
para um produto f(x)g(y) de distribuições de probabilidade de uma variável aleatória cada. 
A covariância, definida como 


co(X,Y)=((X-(X)(Y—(1)),), (19.26) 
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é uma medida do grau de correlação (ou de relação) entre as variáveis aleatórias X, Y: é zero para variáveis 
aleatórias independentes porque 


cov(X,Y) = / (x — (X)) (y — (Y) ) f(z, y) dz dy 
= f œ- (X) fo) de | (u= ao) dy = (0) = (XY) = (1) =0. 


A covariância normalizada DA. que tem valores entre —1 e +1, costuma ser denominada correlação. 


Para demonstrar que a correlação é limitada por 


cov(X,Y) 
“E oo) <! 


, analisamos o valor médio positivo 


Q= ([u(X — (X) +o — ()]) 
=u? ([X — 00] + 2uv([X — 00] [Y - 09] + 0H - Y) 
=uwo(X)? +2uvcov(X,Y) + vlo(Y)? > 0, (19.27) 
em que u, v são números, não funções. Para essa forma quadrática ser não-negativa, seu discriminante deve 


obedecer a cov (X, Y)? — o(X)2o(Y)2 < 0, que prova a desigualdade desejada. 
A utilidade da correlação como uma medida quantitativa é salientada pelo seguinte. 


TEOREMA: P(Y = aX + b) = 1 é válido se, e somente se, a correlação for igual a +1. 


Esse teorema afirma que uma correlação +100% entre X, Y implica não apenas alguma relação funcional entre 
ambas as variáveis aleatórias, mas também uma relação linear entre elas. Denotamos por (B| 4) o valor esperado 
da distribuição de probabilidade condicional P(B|A). 

Para provar essa forte propriedade de correlação, aplicamos a lei da decomposição de Bayes (Equação (19.8)) 
ao valor médio e variância da variável aleatória Y, admitindo primeiro que P(Y = aX + b) = 1, portanto, 
P(Y + aX +b) = 0. Isso resulta em 


(Y) = P(Y = aX +b)(Y |Y = aX +b) 
+ P(Y #aX +b)\(Y|Y ZaX +b) 
= (aX +b) =a(X) + b, 
o(Y)? = P(Y =aX +b)([Y — (Y)| |Y = aX +b) 
+ P(Y #aX +b)([Y - (Y) |Y £ax +b) 
= ([aX +b- ()]) = (02 [X — (X)]’) = 20(X)?, 


substituindo (Y) = a(X) + b. De modo semelhante, obtemos cov(X,Y) = aZo(X)2. Esses resultados mostram 


que a correlação é +1. 
Ao contrário, começamos de cov(X,Y)2 = o(X)2o(Y)2. Por conseguinte, a forma quadrática na 
Equação (19.27) deve ser zero para (praticamente) todo x para algum (wo, vo) (0,0): 


(uo(X —(X)) + vo(r — (NJ) = 0. 


Como o argumento desse valor médio é definido positivo, essa relação é satisfeita somente se P(uo(X — (X)) + 
vo(Y — (Y)) = 0) = 1, o que significa que Y e X são linearmente relacionadas. 

Quando eliminamos uma variável aleatória por integração, ficamos com a distribuição de probabilidade da outra 
variável aleatória, 


"l 


F(a) = l Feau co GUE T f(&, y) de, (19.28) 


e de modo análogo para distribuições de probabilidade discretas. Quando uma ou mais variáveis aleatórias são 
eliminadas por integração, a distribuição de probabilidade remanescente é denominada marginal, motivada pelos 
aspectos geométricos de projeção. A demonstração de que essas distribuições marginais satisfazem todos os 
requisitos de distribuições de probabilidade adequadamente normalizadas é direta. 

Se estivermos interessados na distribuição da variável aleatória X para um valor definido y = yo da outra 
variável aleatória, então estamos tratando com uma distribuição de probabilidade condicional P(X = x|Y = 
yo). A densidade de probabilidade contínua correspondente é f(x, yo). 
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Exemplo 19.2.4 RETIRADAS REPETIDAS DE CARTAS 


Quando tiramos cartas repetidas vezes, embaralhamos o baralho porque queremos ter certeza de que esses eventos 
sejam sempre independentes. Portanto, tiramos a primeira carta aleatoriamente de um baralho de bridge contendo 
52 cartas e então a devolvemos a um lugar aleatório. Agora repetimos o processo para uma segunda carta. Então, 
embaralhamos novamente as cartas, etc. Agora definimos as variáveis aleatórias 

e X = número de cartas denominadas honras, isto é, as cartas 10, valetes, rainhas, reis ou ases; 

e Y = número de cartas 2 ou 3. 


Em uma única retirada a probabilidade de tirar uma carta entre o 10 e o ás é a = 5-4/52 = 5/13 e 
b = 2.4/52 = 2/13, para a retirada de cartas 2 ou 3 e c = (13 — 5 — 2)/13 = 6/13, para qualquer outra 
carta, coma +b+c=1. 

Em duas retiradas X e Y podem ser x = 0 = y, quando não aparecer nenhuma carta entre o 10 e o ás 
ou nenhuma carta 2 ou 3. Esse caso tem probabilidade c. Em geral, X, Y têm os valores 0, 1 e 2, portanto, 
0 < x+y < 2, porque teremos retirado duas cartas. A função probabilidade de (X = x, Y = y) é dada 
pelo produto das probabilidades das três possibilidades a”, b”, c27-Y vezes o número de distribuições (ou 
permutações) de duas cartas sobre os três casos com probabilidades a, b, c, que é 2!/[xly!(2 — x — y)!]. Esse 
número é o coeficiente da potência a” bc?“ na expansão binomial generalizada de todas as possibilidades em 
duas retiradas com probabilidade 1: 


2! 
I=(a+b+o' = 5 —— A aP 
E alyl(2 — a — y)! 
=a? +b? + + 2(ab + ac+ be). (19.29) 


Por conseguinte, a distribuição de probabilidade de nossas variáveis aleatórias discretas é dada por 


EESC suo e — 9)! SC a 


x,y = 0,1,2; 0<zr+y<2, (19.30) 
ou, mais explicitamente, como 
E e man a 
ARS Ee 13 13 132º 


A distribuição de probabilidade é adequadamente normalizada conforme a Equação (19.29). Seus valores esperados 
são dados por 


O<x+y<2 
60 20 5(5 SO O 
132 13? 13) 132 13 


O<x+y<2 
24 2 22 2 4 
= | 2 +2( ) E = = 2b, 
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como esperado, porque estamos retirando uma carta duas vezes. As variâncias são 


10)? 
= D (2-5) Has) 
O<x+y<2 
10)? 
= (15) 00) + 40.1) + 110.2) 
EN 16)? 
+ (5) Lao + 100] + (E) 12,0) 
o 102.64+32.80+162.52  42.5.169 + 80 
= 134 O AS 13? 
4 2 
n= E (1-5) re 
O<a+y<2 


= (5) [f(0,0) + f(1,0) + f(2,0)] 


+ (5) von + £(1,1)] + (2) 10.2) 


— 42.1124+92.444222.22 11-4-169 44 
E 134 = 134 1832 


É razoável que o? (Y) < o?(X), porque Y assume somente dois valores, enquanto X varia sobre as quatro honras. 


A covariância é dada por 
10 4 
5 («- 5) (»- 3) to) 


O<x+y<2 
-10-4 6? 10-9 24 10.22 4 3-4 60 
132 132 132 132 132 132? 132 132 


cov(X,Y) 


pena 20 16-4 5? 20-169 20 
132? 132 132? 132 134 13% 
Portanto, a correlação das variáveis aleatórias X, Y é dada por 
cov( X,Y) 20 1 /5 


E = = —0, 3371, 
o(X)o(Y)  8/5-11 2V1 


o que significa que há uma pequena correlação (negativa) entre essas variáveis aleatórias porque, se uma carta for 
uma honra, não pode ser um 2 ou um 3, e vice-versa. 
Por fim, vamos determinar a distribuição marginal: 


F(X = x)= Ñ_ f(2,y), (19.31) 


ou, explicitamente, 


ro=100+100+802)=(8) G (5). 


60 20 80 
F(1) = f(1,0) + f(1,1) = 132 H 132 = 132º 


F) = 1(2,0) = (G a 


13 
que é adequadamente normalizada porque 


- 64+80+25 169 


F(0) + F(1) + F(2) 132 132 


=1. 
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Seu valor médio é dado por 


80+2:-25 130 10 
=: — = = X 
132 132 13 Adi 


(X)r = X_ F(x) = F(1) +2F(2) 


e sua variância 
2 2 2 2 2 2 2 
10 10 8 3 80 16 5 
2 
= = F = — . — . 
EP Lh T) (a) (5) (53) + (3) + (3) (53) 


Pela definições, vemos que esses resultados em geral são válidos. E 


Por fim, abordamos a transformação de duas variáveis aleatórias X, Y em U(X,Y), V(X,Y). Tratamos o caso 
contínuo e deixamos o caso discreto como um exercício. Se 


u=ulry,  v=v(z,y); v=a(uv),  y=yluo) (19.32) 


descreve a transformação e sua inversa, então a probabilidade permanece invariante e a integral da densidade se 
transforma de acordo com as regras de jacobianos, Capítulo 2, portanto, a densidade de probabilidade transformada 
se torna 


glu, v) = f (x(u, v), y(u, v)) |J], (19.33) 
com o jacobiano 
ay) | de S 
J= Blu o) | du du (19.34) 


Exemplo 19.2.5 SOMA, PRODUTO E RAZÃO DE VARIÁVEIS 


Vamos considerar três exemplos. 
(1) A soma Z = X + Y, em que a transformação pode ser considerada 


11 
= 2=2+y, Talo ME 
usando 
dx a(z — y) dy a(z — x) 
dx i ðz dz 0, z i 
portanto, a probabilidade é dada por 
Z oo 
F(Z) = / / f(x,z — x) de dz. (19.35) 
Se as variáveis aleatórias X, Y forem independentes com densidades fı, fo, então 
Z oo 
F(Z) = / / fila) fo(z — x) da dz. (19.36) 
(2) O produto Z = XY, considerando X, Z as novas variáveis, leva ao jacobiano 
1 ż 1 
= yY = — 
s-h RE 
usando 
ðr o$) 1 Oy o dz) 1 
de dz y’ dr dz r 
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portanto, a probabilidade é dada por 


Z [o0] 
r2 = f / (E) das (19.37) 


Se as variáveis aleatórias X, Y forem independentes com densidades f1, f2, então 


Z oo 
r2) = [ / fitojta(E) Dido (19.38) 


(3) A razão Z = E, considerando Y, Z as novas variáveis, tem o jacobiano 


Rea DR a 
usando 
O(yz) O(yz) dy dy 
=2 =y, AR Do 0, 
dy Õz dy Oz 
portanto, a probabilidade é dada por 
Z oo 
F(Z) = / Í f (yz, y)|y| dy dz. (19.39) 
Se as variáveis aleatórias X, Y forem independentes com densidades f1, f2, então, 
Z oo 
ro f | tiy)falo)l duas (19.40) 


Exercícios 


19.2.1 Mostre que somar uma constante c a uma variável aleatória X altera o valor esperado (X) por 
essa mesma constante, mas não altera a variância. Mostre também que multiplicar uma variável 
aleatória por uma constante multiplica ambas a média e a variância — por essa constante. Mostre 
que a variável aleatória X — (X) tem valor médio zero. 


19.2.2 Se (X), (Y) são os valores médios de duas variáveis aleatórias independentes X, Y, qual é o valor 
esperado do produto X - Y? 
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19.2.3 Uma velocidade v; = x;/t; é medida registrando as distâncias x; nos tempos correspondentes tj. 
Mostre que 7/1 é uma boa aproximação para a velocidade média v, contanto que todos os erros 
lv; — z| « |z| e It; — t| « |t| sejam pequenos. 

19.2.4 Defina a variável aleatória Y no Exemplo 19.2.4 como o número de 4s, 5s, 6s, 7s, 8s ou 9s. Então 
determine a correlação das variáveis aleatórias X e Y. 


19.2.5 Se X e Y são duas variáveis aleatórias independentes com diferentes densidades de probabilidade 
e a função f(x,y) tem derivadas de qualquer ordem, expresse (f(X,Y)) em termos de (X) e (Y). 
Desenvolva a covariância e a correlação de modo semelhante. 


19.2.6 Seja f(x,y) a densidade de probabilidade conjunta de duas variáveis aleatórias X, Y. Ache 
a variância o2(aX + bY), em que a, b são constantes. O que acontece quando X, Y são 
independentes? 


19.2.7 | A probabilidade de uma partícula de um gás ideal percorrer uma pequena distância dx entre colisões 
é ~e™?/f dx, em que f é o caminho livre médio constante. Verifique que f é a distância média entre 
colisões e determine a probabilidade de um caminho livre de comprimento l > 3f. 


19.2.8 Determine a densidade de probabilidade para uma partícula em movimento harmônico simples no 
intervalo —A < x < A. 
Sugestão: A probabilidade de a partícula estar entre x e x + dx é proporcional ao tempo que ela 
leva para atravessar o intervalo. 


19.3 Distribuição Binomial 


Exemplo 19.3.1 REPETIDOS LANÇAMENTOS DE DADOS 


Qual é a probabilidade de sair três 6 em quatro lançamentos, sendo todas as tentativas independentes? Tirar um 
6 em um único lançamento de um dado não-viciado tem probabilidade a = 1/6, e qualquer outra coisa tem 
probabilidade b = 5/6 com a + b = 1. Seja a variável aleatória X = x o número de 6. Em quatro lançamentos, 
0 < x < 4. A distribuição de probabilidade f(X) é dada pelo produto das duas possibilidades, a” e b477, vezes 
o número de combinações de quatro lançamentos sobre os dois casos com probabilidades a, b. Esse número é 
o coeficiente da potência a”b!-” na expansão binomial de todas as possibilidades em quatro lançamentos com 
probabilidade 1: 


4 4! 
IRES +b 4 == g This 
a) > x!(4— q)! e 
= af + bÍ + 4a°b + 4ab? + 6a°b?. (19.41) 


Por conseguinte, a distribuição de probabilidade de nossa variável aleatória discreta é dada por 


4! 


xrp4—r 
ads , 0O<a<a, 


AO = 
ou, mais explicitamente, por 
HO =,  fA)=4ab?,  f(2)=6ab?,  f(3)=4a°b,  f(4) =a". 


A distribuição de probabilidade é adequadamente normalizada conforme a Equação (19.41). A probabilidade de 
tirar três 6 em quatro lançamentos é 


razoavelmente pequena. E 


Esse caso tratou com tentativas repetidas independentes, cada uma com dois resultados possíveis de 
probabilidade constante p para um sucesso e q = 1 — p para um fracasso, e é típico de muitas aplicações, tais 
como produtos defeituosos, acertar ou errar um alvo e degradação de átomos radioativos. A generalização para 
X = q sucessos em n tentativas é dada pela distribuição binomial de probabilidade 


| 
f(X = 2) = ] = Ak = (rar (19.42) 
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usando os coeficientes binomiais (veja o Capítulo 5). Essa distribuição é normalizada para a probabilidade 1 de 
todas as possibilidades em n tentativas, como se pode ver pela expansão binomial 


l=(p+9" =p" +np tqt tnp + q". (19.43) 


A Figura 19.5 mostra histogramas típicos. A variável aleatória X assume os valores 0,1,2,...,n em etapas 
discretas e também pode ser vista como uma composição 37, X; de n variáveis aleatórias independentes X;, 
uma para cada tentativa, que tem o valor O para um fracasso e 1 para um sucesso. Essa observação nos permite 
empregar funções geradoras de momento 


(€X) = P(X: = 0) + P(X; = 1) = q+ pet (19.44) 


(ex) = [[ (6) = (pe' +4)”, (19.45) 


2 4 6 8 10 12 14 
Figura 19.5: Distribuições binomiais de probabilidade para n = 20 e p = 0, 1; 0,3; 0,5. 


das quais podemos ler os valores médios e momentos mais altos diferenciando e fazendo t = 0. Usando 


ð tX TE 
e ) = npe' (pet + q) E 
O(e!tX 
e = (X) = X ala) = np, 
t=0 i 
82 tX ao fo 
- = npe (pe* + q) ! 4 n(n — 1)pe” (pet + q) E 
92X) 
2\ o 2 j E, 
(= Dto) = ntaa- np, 


obtemos, com a Equação (19.19), 


o’ (X) = (X?) = (XY = np + n(n — Dp? — nºp? 
= np(1 — p) = npq. (19.46) 


A Figura 19.5 ilustra esses resultados com picos em x = np = 2,6,10, que ficam mais largos à medida que p 
cresce. 
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Exercícios 
19.3.1 Mostre que a variável X = x número de caras em n lançamentos de uma moeda é uma variável 
aleatória e determine sua distribuição de probabilidade. Descreva o espaço amostral. Qual é 
seu valor médio, a variância e o desvio padrão? Construa um gráfico da função probabilidade 
f(x) = n!/(x!(n — x)!2”) para n = 10, 20, 30, usando software gráfico. 
19.3.2 Construa o gráfico para a função probabilidade binomial para as probabilidades p = 1/6, q = 5/6 
e n = 6 lançamentos de um dado. 


19.3.3 Um fabricante de ferragens sabe que a probabilidade de produzir pregos em massa inclui uma 
pequena probabilidade p = 0,03 de pregos defeituosos (o defeito mais comum são pregos sem 
ponta). Qual é a probabilidade de achar mais do que dois pregos defeituosos em uma caixa de 100 
pregos vendida ao mercado? 


19.3.4 Quatro cartas são retiradas de um baralho de bridge embaralhado. Qual é a probabilidade de que 
todas sejam vermelhas? Todas sejam de copas? Todas sejam honras? Compare as probabilidades 
quando as cartas são ou não devolvidas ao baralho em lugares aleatórios. 


19.3.5 | Mostre que para a distribuição binomial da Equação (19.42) o valor mais provável de x é np. 


19.4 Distribuição de Poisson 

A distribuição de Poisson ocorre tipicamente em situações que envolvem um evento repetido a uma taxa constante 
de probabilidade e, por isso, esgota a população. A degradação de uma amostra radioativa é um caso em questão 
porque, uma vez degradada a partícula, ela não se degradará novamente. Se o tempo de observação dt for 
suficientemente pequeno de modo que a emissão de duas ou mais partículas seja desprezível, então a probabilidade 
de uma partícula (He! em degradação a ou um elétron em degradação 8) ser emitida é udt, com u constante 
e udt < 1. Podemos estabelecer uma relação de recursão para a probabilidade P, (t) de observar n contagens 
durante um intervalo de tempo t. Para n > 0, a probabilidade P, (t + dt) é composta de dois eventos mutuamente 
exclusivos, ou seja, n partículas são emitidas no tempo t, nenhuma em dt e (ii) n — 1 partículas são emitidas no 
tempo t, uma em dt. Por conseguinte, 


Pat + dt) = P (t) Po(dt) + Pa(t) Pi(dt). 


Aqui, substituímos a probabilidade de observar uma partícula, Pi(dt) = udt, e nenhuma partícula, Po(dt) = 
1 — Pı (dt), no tempo dt, o que resulta em 


Pat + dt) = Pa (1 — udt) + Pa-1(t)u dt. 
Assim, após rearranjar e dividir por dt, obtemos 


dPa(t) Palt+ dt) — Palt) 
= = uPa-1 (t) — uPalt). 19.47 
= 5 HPna (t) — uPa(?) (19.47) 
Para n = 0, essa relação de recursão diferencial simplifica, porque não há nenhuma partícula nos tempos t e dt 


resultando em 


= -u P(t). (19.48) 


A EDO diz que partículas têm uma probabilidade de degradação constante e a degradação as remove da 
distribuição. Essa EDO integra para Po(t) = et, se for usada a probabilidade de nenhuma partícula ser emitida 
durante um intervalo de tempo Po(0) = 1. Aqui, Po(0) = 1 significa que não ocorre nenhuma degradação em 
t<0. 

Agora, voltamos à Equação (19.47), para n = 1, 


È, = u(e™ — Pi), P(0)=0, (19.49) 


2 


e resolvemos a equação homogênea, que é a mesma para Pı, como na Equação (19.48). Isso resulta em 
Pı (t) = ue” **. Então resolvemos a EDO não-homogênea (Equação (19.49)) variando a constante | para achar 
im = u, portanto, Pı (t) = ute” tt. A solução geral é 


Pat) = et, (19.50) 
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como pode ser confirmado por substituição na Equação (19.47) e verificando as condições iniciais, P.(0) = 0, 
n > 0. Esse é um exemplo da distribuição de Poisson. 
A distribuição de Poisson é definida com as probabilidades 


p(n) = =e", X =n =0,1,2,... $ (19.51) 


e é exibida na Figura 19.6. A variável aleatória X é discreta. As probabilidades são adequadamente normalizadas 
porque e7” 5. o £7 = 1. O valor médio e a variância, 


p(n) 


0,3 
n=10 
-8 
0.2 P™ 20 
— Binomial 


— Poisson: u=3 


1 


Figura 19.6: Distribuição de Poisson comparada com distribuição binomial. 


(X) =e”) na =" or =, 
n=1 ` n=0 ` 


o?’ = (X?) - (XY = u(p +1) - p? = p, (19.52) 
resultam da função característica 
itX = itn— ur — > (ue!) et—1 
(e NE E e e Ta = e ) 
n=0 n=0 


por diferenciação e fazendo t = 0, usando a Equação (19.19). 

Uma distribuição de Poisson se torna uma boa aproximação da distribuição binomial para um número grande n 
de tentativas e pequena probabilidade p ~ u/n, u uma constante. 
TEOREMA: No limite n — œ e p — 0 permanece finito, a distribuição binominal np > p se torna uma 
distribuição de Poisson. 

Para provar esse teorema, aplicamos a fórmula de Stirling (Capítulo 8) n! ~ v2an(n/e)” para n grande aos 
fatoriais na Equação (19.42), mantendo « finito, enquanto n — oo. Para n — oo, isso resulta em: 


pato a 
(O) (raia) ol) mm 


e para n > œ, p > 0, com np > p: 


(1 =p) ~ (1-=) X (1- 3 ~ e`", 
n n 
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Por fim, p”n” — u”, portanto, no geral, 
n! x 
i P7 p)" E E n> o, (19.53) 
a!l(n — zx) q! 


que é uma distribuição de Poisson para a variável aleatória X = x, com 0 < x < œ. Esse teorema de limite é um 
exemplo particular das leis dos grande números. 


Exercícios 
19.4.1 Degradações radioativas são governadas pela distribuição de Poisson. Em um experimento 
de Rutherford-Geiger o número n; de partículas a emitidas é contado em n = 2,608 intervalos 
de tempo de 7, 5 segundos cada. Na Tabela 19.1 n; é o número de intervalos de tempo nos quais à 
partículas foram emitidas. Determine o número médio A de partículas emitidas e compare os n; da 
Tabela 19.1 com os np; calculados pela distribuição de Poisson com valor médio A. 


Tabela 19.1 


i— 0 1 2 3 4 5 6 7 8 9 10 
ni — 57 203 383 525 532 408 273 139 45 27 16 


19.4.2 Derive o desvio padrão de uma distribuição de Poisson de valor médio p. 


19.4.3 O número de partículas œ que decorrem de uma amostra de rádio é contado por minuto durante 
40 horas. O número total é 5.000. Quantos intervalos de 1 minuto são esperados com (a) 2, (b) 5 
partículas a? 


19.4.4 Para uma amostra radioativa são contados 10 decaimentos em média em 100 segundos. Use a 
distribuição de Poisson para estimar a probabilidade de contar 3 decaimentos em 10 segundos. 


19.4.5 | O ?38U tem uma meia-vida de 4,51 x 10° anos. Sua série de decaimento termina com o isótopo 
de chumbo estável 2º%Pb. A razão entre o número de átomos de 2ººPb e de ?38U em uma amostra 
de rocha é medida como 0, 0058. Estime a idade da rocha admitindo que todo o chumbo presente 
nela vem do decaimento inicial do ?38U, o que determina a taxa de todo o processo de decaimento, 
porque as etapas subsequentes ocorrem com rapidez muito maior. 

Sugestão: A relação entre a decaimento constante À na lei de decaimento N (t) = Ne N e o tempo 
de meia-vida T é T = ln 2/À. 
Resposta: 3,8 x 107 anos. 


19.4.6 Sabe-se que a probabilidade de acertar um alvo com um único tiro é de 20%. Se cinco tiros forem 
disparados independentemente, qual é a probabilidade de acertar o alvo ao menos uma vez? 


19.4.7 | Sabe-se que um pedaço de urânio contém os isótopos ?3U e ?3$U bem como 0, 80 g de ?9$Pb por 


grama de urânio. Estime a idade do pedaço (portanto, Terra) em anos. 
Sugestão: Admita que o chumbo vem somente do $U. Use a constante de degradação do 


Exercício 19.4.5. 


19.5 Distribução Normal de Gauss 
A distribuição de Gauss em forma de sino é definida pela densidade de probabilidade 


2 
f(x) = e ap(-ESEL), -00 < £ < 00, (19.54) 


osn 20? 


com valor médio p e variância o2. Ela é, de longe, a mais importante distribuição de probabilidade contínua e é 
apresentada na Figura 19.7. 


Ela é adequadamente normalizada porque, substituindo y = E 


A obtemos 


1 a a? r 1 m -v g 2 T: “Pg 1 
o e 22 de= —= e == e =1. 
Ov 27 J-o VT — oo i VT 0 7 


De modo semelhante, substituindo y = x — u, vemos que 


oo o =? o0 2 
w -=f E dad or de= | y e 272 dy = 0, 


“oo OV 2T “co OV 2T 


“livro” — 2007/8/1 — 15:06 — page 862 — #872 


862 Física Matemática Arfken e Weber ELSEVIER 


” 


>» x 


m n 0 n m I 
Figura 19.7: Distribuição normal de Gauss para valor médio zero e vários desvios padrão h = 1/02. 


sendo a integranda ímpar em y, de modo que a integral sobre y > 0 cancela a integral sobre y < 0. De modo 


semelhante, verificamos que o desvio padrão é o. 


Pela distribuição normal (pela substituição y = z=), 


P(|X - (X)| > ko) = p( Et > +) =P(|Y|>+k) 


1 Ro 4 [O k 
= I e782 dy = VE ec dz = erfe—, 
Tjk TJu/v2 v2 


podemos avaliar a integral para k = 1,2,3 e assim extrair as seguintes relações numéricas para uma variável 
aleatória normalmente distribuída: 
P(|X — (X)| > a) ~ 0,3173, P(|X — (X)| > 20) ~ 0,0455, 

P(|X — (X)| > 30) ~ 0,0027, (19.55) 
dentre as quais a última é interessante para comparar com a desigualdade de Chebychev (veja a Equação (19.21)) 
dando < 1/9 para uma distribuição de probabilidade arbitrária em vez de ~ 0,0027 para a regra dos 30 de 
distribuição normal. 
TEOREMA DA ADIÇAO: Se as variáveis aleatórias X,Y têm as mesmas distribuições normais, isto é, o 
mesmo valor médio e a mesma variância, então Z = X + Y tem distribuição normal com duas vezes o valor 


médio e duas vezes a variância de X e Y. 
Para provar esse teorema, consideramos a densidade de Gauss 


—z?/2 


1 1 o 2 
= =—2*/2 2 
xr) = ——e ; com —— e dx= 1, 
Ha) y 27 y 27 do 
sem perda de generalidade. Então, a densidade de probabilidade de (X, Y ) é o produto 


1 2 1 2 1 2 2 
= ~x" /2 =y'/2 — —(2º+y)/2 
z, y) = e e =e a 

fens 5 

Além disso, a Equação (19.36) dá a densidade para Z = X + Y como 


* 2 1 2 
= e éf2 Do „—(z—-z) 2d 

z) = e e L. 
oa) J. V 2T V2T 


Completando o quadrado no expoente, 


2 2 
27º — 2z + 2? = (22- =) pan 
va 3 


obtemos 
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z 
29 


Paje- [Lotus 


portanto, a densidade para Z = X +Y é 


Usando a substituição u = x — 5, constatamos que a integral se transforma em 


1 é 
g(z) = —=e "4, (19.56) 


o que significa que tem valor médio zero e variância 2, duas vezes a de X e Y. 

Em um limite especial, a distribuição de probabilidade discreta de Poisson guarda estreita relação com a 
distribuição contínua de Gauss. Esse teorema do limite é outro exemplo das leis dos grandes números, que muitas 
vezes são dominadas pela distribuição normal em forma de sino. 


TEOREMA: Para n grande e valor médio |, a distribuição de Poisson se aproxima de uma distribuição de Gauss. 


Para provar esse teorema para n — oo, aproximamos o fatorial na probabilidade de Poisson p(n) da 
Equação (19.51) pela fórmula assintótica de Stirling (veja o Capítulo 8), 


n 
— fn 
ni~ VEm(2) E n — 00, 
e 


e escolhemos o desvio v = n — u em relação ao valor médio como a nova variável. Deixamos o valor médio 
u — œ e tratamos v/ju como pequeno, mas v? /u como finito. Substituindo n = u + v e expandindo o logaritmo 
em uma série de Maclaurin, mantendo dois termos, obtemos 


lnp(n) = —u+nln up- nlnn +n -— lIn v2nr 
E a 40 In T 


= (u+ 0)m(1- >) +v -1n vma 
= (u+0)( E E J+ In 2ra 


+o Muro) 


2 
RER V 2TH, 
2u 

substituindo u + v — p, porque |v| < u. Exponenciando esse resultado, constatamos que, para n e u com, 

(n> 
n) > —— 
o v27u 
que é a distribuição de Gauss da variável contínua v com valor médio 0 e desvio padrão o = ,/jt. 


Em um limite especial, a distribuição de probabilidade binomial discreta também guarda estreita relação com a 
distribuição contínua de Gauss. Esse teorema de limite é outro exemplo das leis dos grandes números. 


eu, (19.57) 


TEOREMA: No limite n — œ, de modo que o valor médio np — œ, a distribuição binomial se torna uma 
distribuição normal de Gauss. Lembre-se, da Seção 19.4, que, quando np > u < œ, a distribuição binomial se 
torna uma distribuição de Poisson. 


Em vez do grande número x de sucessos em n tentativas, usamos desvio v = x — pn em relação ao (grande) valor 
médio pn como nossa nova variável aleatória contínua, sob a condição de que |v| < pn, mas v2/n é finito quando 
n — 00. Assim, substituímos x por v + pn e n — x por gn — v nos fatoriais da Equação (19.42), f(x) — W (v), 
quando n — oo, e então aplicamos a fórmula de Stirling, o que resulta em 


pq" Ent e-ntetin—s) 
v2n(v + pn)t+/2(qn — vn 24/20 


Aqui excluímos as potências dominantes de n por fatoração e cancelamos potências de p e q para achar 


1 o —(v+pn+1/2) n —(qn—v+1/2) 
W(v) = 1 1 — — : 
(v) V27pgn ( E =) ( =) 


W(v) = 
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Em termos do logaritmo, temos 


(0) 
E. 1/9n(1+ — 
v2mpgn (ar nado) a( +) 


£ fan = +13) m( = =) 


qn 
1 v v? 
aeea Po ea E 
ngg (tm + (O ate) 
(an v+1/)(-L + 
ES ei sat E To 
4 qn 2g2n? 
| 1 v/1 1 p Lol a 
=n ... 
v2mpgn nÃ2p 2q n \2p Qq : 
em que 
v v? 
E ð; E 
n n 
é finito e 


( 1 ii 1 ) o p+4q_ 1! 
2p 2q 2pq  2pq 
Desprezando ordens mais altas em v/n, tais como v? /p?°n? e v? /g2n2, achamos o limite de n grande 


1 2 
= —v?/2pgn 1 
W (v) Tono ; (19.58) 


que é uma distribuição gaussiana nos desvios x — pn, com valor médio 0 e desvio padrão o = „/npq. O valor 
médio grande pn (e os termos descartados) restringe a validade do teorema à parte 


Exercícios 
19.5.1 Qual é a probabilidade de uma variável aleatória normalmente distribuída ter mais do que 4ø de 
diferença em relação a seu valor médio? Compare seu resultado com um resultado correspondente 
da desigualdade de Chebychev. Explique a diferença com suas próprias palavras. 


19.5.2 Sejam X1, X2,..., Xn variáveis aleatórias normais independentes com a mesma média % e 
variância o2. Mostre que Zoe é normal com média 0 e variância 1. 

19.5.3 Um professor dá notas a um exame final de uma turma com grande número de alunos obtendo o 
valor médio de pontos M e a variância o2. Admitindo uma distribuição normal para o número M 
de pontos, ele define uma nota F quando M < m — 30/2 D, quando m — 30/2 < M < m — o /2; 
C, quando m — o/2 < M < m + 0/2, B quando m + 0o/2 < M < m + 30/2 A, quando 
M > m + 30/2. Qual é a percentagem de As, Fs; Bs, Ds; Cs? Proponha novos cortes de modo a 
haver percentagens iguais de As e Fs (5%), 25% Bs e Ds, e de 40% Cs. 


19.5.4 Se a variável aleatória X é normal com valor médio 29 e desvio padrão 3, quais são as distribuições 
de2X — 1e 3X +22 


19.5.5 Para uma distribuição normal de valor médio m e variância o2, ache a distância r, tal que metade 
da área sob a curva em forma de sino esteja entrem — rem +r. 


19.6 Estatística 


Em Estatística, a teoria da probabilidade é aplicada à avaliação de dados de experimentos aleatórios ou a 
amostras para testar alguma hipótese porque os dados têm flutuações aleatórias por falta de controle total das 
condições experimentais. Normalmente, tentamos estimar o valor médio e a variância das distribuições, das quais 
as amostras derivam, e generalizar propriedades válidas para uma amostra para o restante dos eventos com 
um nível de confiança prescrito. Qualquer suposição sobre uma distribuição de probabilidade desconhecida é 
denominada hipótese estatística. Os conceitos de testes e intervalos de confiança estão entre os mais importantes 
desenvolvimentos da Estatística. 
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Propagação de Erro 
Quando medimos uma quantidade x repetidas vezes, obtendo os valores x; ao acaso, ou selecionamos uma amostra 
para teste, determinamos o valor médio (veja a Equação (19.10)) e a variância, 


2= 5) ay 2="5 (e-a), 


j=1 j=1 


como uma medida do erro ou dispersão em relação ao valor médio %. Podemos escrever xj = 7+ ej, em que o erro 
ej é o desvio em relação ao valor médio, e sabemos que D ej = 0. (Veja a discussão após a Equação (19.15).) 

Agora, suponha que queremos determinar uma função conhecida f(x) a partir dessas medições, isto é, temos 
um conjunto f; = f(x;) das medições de x. Substituindo x; = 7 + e; e formando o valor médio por 


[=D fa) = Y Ete) 


J 


J 


= f(z) T PDD + LOPIES 


tm +, (19.59) 


obtemos o valor médio f como f(x) em ordem mais baixa, como esperado. Mas em segunda ordem há uma 
correção dada por metade da variância com um fator de escala f(x). É interessante comparar essa correção do 
valor médio com a dispersão média de f; individuais em relação ao valor médio f, a variância de f. Para ordem 
mais baixa, isso é dado pela média da soma dos quadrados dos desvios no qual aproximamos f; = f + f'(x)e;, 
resultando em 


= 1 
ana-a- Pre Eao (19.60) 
K] j 
Resumindo, podemos formular, até certo ponto simbolicamente, 
fato)= f(E) + (a) 


como a forma mais simples de propagação de erro por uma função de uma variável medida. 
Para uma função f(£j, yk) de duas quantidades medidas xj = Z + uj, Yk = Y + vk, obtemos, de modo 
semelhante, 


=D Y fas ED Etung) 


j=1 k=1 j=1 k=1 


1 1 
Sites la Do Duas 
I 


em que D uj = 0 = Ì, vk, portanto, novamente, f = f(z, 4) em ordem mais baixa. Aqui, 


o o 
6-0 ho 50.0) (19.61) 


denota derivadas parciais. A soma dos quadrados dos desvios em relação ao valor médio é dada por 
Dn =D (wfe torfy) =D urriid vê, 
j=1 k+1 j,k j k 


porque }`; p UjUk = >; Uj J p Vk = 0. Por conseguinte, a variância é 


Ap) =E El- PP = o fo), (19.62) 


j,k 
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com fz, fy pela Equação (19.61), e 


são as variâncias dos pontos de dados x e y. Simbolicamente, a propagação de erro para uma função de duas 
variáveis medidas pode ser resumida como 


f(E +0,9 Eoy) = (7,0) + [202 + fho. 


Como aplicação e generalização do último resultado, agora calculamos o erro do valor médio bar 7 = 
1 -DDN — zj de uma amostra a n medições individuais xj, cada uma com dispersão o. Nesse caso, as derivadas 


parciais são dadas por fr = A = fy =: € Or = 0 = Oy = ++: . Assim, nossa última regra da propagação de 
erro nos diz que erros de uma soma de variáveis somam-se quadraticamente, de modo que a incerteza da média 
aritmética é dada por 


a 


1 —s o 
2 19. 
q no m (19.63) 


decrescendo com o número de medições n. 


A medida que o número n de medições aumenta, esperamos que a média aritmética % convirja para algum valor 
verdadeiro x. Admitindo que a diferença entre 7 e x é a ev; = x; — x são os desvios verdadeiros, então, 


psi y oro 
j 
Levando em conta o erro da média aritmética, determinamos a dispersão dos pontos individuais em torno do valor 
médio verdadeiro desconhecido como 


1 
= 2 — 
-D4 Dire? 
j 
De acordo com nossa discussão anterior que resultou na Equação (19.63), a? = lg?, o que dá como resultado 


ES pe 


do qual resulta o desvio padrão de uma amostra em estatística, como segue, 


2 TE 
ga 50; Ec a (19.64) 


sendo n — 1 o número de medições de controle da amostra. Esse erro médio modificado inclui o erro esperado na 
média aritmética. 

Como a dispersão não é bem definida quando não há nenhuma medição de comparação, isto é, quando n = 1, 
a variância às vezes é definida pela Equação (19.64), na qual substituímos o número n de medições pelo número 
n — 1 de medições de controle em Estatística. 


Ajuste de Curvas a Dados 
Suponha que temos uma amostra de medições y; (por exemplo, uma partícula em movimento livre, isto é, sob 
nenhuma força) tomadas em tempos conhecidos t; (que consideramos praticamente livres de erros; isto é, o tempo 
t é uma variável independente ordinária) que esperamos estejam linearmente relacionadas como y = at, nossa 
hipótese. Queremos ajustar essa reta aos dados. 

Primeiro minimizamos a soma dos desvios 57 j (at; — yj)? para determinar o parâmetro de inclinação a, também 
denominado coeficiente de regressão, usando o método dos mínimos quadrados. Diferenciando em relação a a, 


obtemos 
25 (at; m Vit; = 0, 
j 
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da qual resulta 
ais E j titi 
Dyt 


Note que o numerador é construído como uma covariância de amostra, o produto escalar das variáveis t, y da 
amostra. Como mostra a Figura 19.8, como regra geral, os valores medidos y; não se encontram sobre a reta. Eles 
têm a dispersão (ou raiz quadrada dos desvios médios ao quadrado em relação à reta ajustada) 


há 


(19.65) 


0 


Figura 19.8: Linha reta ajustada aos pontos de dados (tj, yj), sendo t; conhecidos, y; medidos. 


Como alternativa, sejam os valores y; conhecidos (sem erro), enquanto tj são medições. Como sugerido pela 
Figura 19.9, nesse caso precisamos permutar o papel de t e y e ajustar a reta t = by aos pontos de dados. 
Minimizamos 57 j (by; — t;)2, igualamos as derivadas em relação a b a zero, e achamos, de modo semelhante, 
o parâmetro de inclinação 


= È; tjYj 
D 


Caso t; e y; tenham erros (consideramos que t e y têm as mesmas unidades), temos de minimizar a soma dos 
quadrados dos desvios de ambas as variáveis e ajustar a uma parametrização tsen œ — y cosa = 0, em que t e y 
ocorrem em igualdade de condições. Como mostrado na Figura 19.10a, em termos geométricos isso significa que 
a reta tem de ser traçada de modo que a soma dos quadrados das distâncias d; entre os pontos (tj, yj) e a reta se 
torne um mínimo (veja a Figura 19.10b e o Capítulo 1). Aqui, d; = tjsen a — y; cosa, portanto, Doi d? = mínimo 
deve ser resolvida para o ângulo a. Igualando a derivada em relação ao ângulo a zero, 


b (19.66) 


> (tsen a — yj cos œ) (tj cos œ + yjsen a) = 0, 
j 
temos como resultado 


sen acosa X (t = y) = ( cos? a — sen?a) E t;y; — 0. 
j j 
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0 


Figura 19.9: Linha reta ajustada aos pontos de dados (t;, yj), com y; conhecidos, t; medidas. 


y 


y 
“Di 
gi 

t 
0 0 
t 


ZA 
w NA 
i 


(a) (b) 


Figura 19.10: (a) Linha reta ajustada aos pontos de dados (t;, yj). (b) Geometria dos desvios uj, v;, dj. 
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Portanto, o ângulo do ajuste da linha reta é dado por 


254; tjYj 
L6 æ y3) 


Esse ajuste de mínimos quadrados se aplica quando os erros de medição são desconhecidos. Ele permite atribuir 
no mínimo algum tipo de barra de erro aos pontos medidos. Lembre-se de que não usamos erros para os pontos. É 
muito provável que nosso parâmetro a (ou œ) reproduzirá os dados sob essas circunstâncias. Mais precisamente, 
o método dos mínimos quadrados é uma estimativa de máxima probabilidade dos parâmetros ajustados quando é 
razoável admitir que os erros são independentes e normalmente distribuídos com o mesmo desvio para todos os 
pontos. Essa suposição razoavelmente forte pode ser relaxada em ajustes por mínimos quadrados “ponderados” 
denominados ajustes de qui quadrado.* 


tg 2a = (19.67) 


A Distribuição x? 
Essa distribuição é normalmente aplicada a ajustes de uma curva y(t,a,...) com parâmetros a,... a dados tj, 
usando o método dos mínimos quadrados envolvendo a soma ponderada dos quadrados dos desvios, isto é, 


ai Yj — Ult...) ? 
2 j jQ; 
XS > k y; ) 
j=1 


é minimizado, em que N é o número de pontos e r é o número de parâmetros ajustados a,... Essa função de 
mérito quadrática dá mais peso a pontos com pequenas incertezas de medição Ay;. 

Representamos cada ponto por uma variável aleatória X normalmente distribuída com valor médio zero e 
variância o? = 1, esta última em vista dos pesos na função x2. Como primeira etapa, determinamos a densidade de 
probabilidade para a variável aleatória Y = X? de um único ponto que assume somente valores positivos. Admitir 
um valor médio zero não prejudica a generalidade porque, se (X) = m 0, consideraríamos a variável deslocada 
Y = X — m, cujo valor médio é zero. Mostramos que, se X tiver uma densidade normal de Gauss, 


1 
fla) = e7720? —00 < T < œ, 


ov'27 
então a probabilidade de a variável aleatória Y ser zero se y < 0, e 
PY < y) = P(X? < y) = P(-vVy < X < vy) se y>0. 


Pela distribuição normal contínua P(y) = [º..f(x)dz, obtemos a densidade de probabilidade g(y) 
diferenciação: 


glu) = dy P) =P) ='5 = U SEE) 
1 
= —— e2? y>0. (19.68) 
Essa densidade, ~ e7”/ 20° /N/Y, corresponde ao integrando da integral de Euler da função gama. Tal distribuição 


de probabilidade 


p—1 


gly) = Tp) (202)? Tai 


é denominada distribuição gama com parâmetros p e o. Sua função característica, para nosso caso, p = 1/2, é 
proporcional à transformada de Fourier 


lY) e 1 T e7Y(1/20°—it) dy Re 1 m era da 
ov'27 Jo vY ov2r(z — it)!/2 Jo VT 
= (1-2ito?) 2 


“Se quiser mais detalhes, veja o Capítulo 14 de Press et al. em Leituras Adicionais do Capítulo 9. 
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Uma vez que a função amostra x? contém uma soma de quadrados, precisamos do teorema a seguir. 


TEOREMA DA ADIÇÃO para as distribuições gama: Se as variáveis aleatórias independentes Y, e Y> tiverem 
uma distribuição gama com p = 1/2 e o mesmo 0, então Yı + Y> tem uma distribuição gama com p = 1. 


Visto que Y e Yə são independentes, o produto de suas densidades (Equação (19.36)) gera a função 
característica 


(e1 +Y2)y — (e ey es ( (e) = (1 = Zito?) +. (19.69) 


Agora chegamos à segunda etapa. Avaliamos a qualidade do ajuste pela variável aleatória Y = EA X?, onde 
n = N — r é o número de graus de liberdade para N pontos de dados e r parâmetros ajustados. As variáveis 
aleatórias independentes X; são consideradas normalmente distribuídas com a variância (da amostra) o2. (Em 
nosso caso, r = 1 e o = 1.) Na verdade, a análise de x? não testa as suposições de normalidade e independência, 
mas se elas não forem aproximadamente válidas, haverá muitos pontos fora da curva de ajuste. O teorema da adição 
dá a densidade de probabilidade (Figura 19.11) para Y, 


nY) 


O 2 4 6 8 10 12 14 


Figura 19.11: Densidade de probabilidade x? de gn (y). 


y > 0, 


e gn(y) = O se y < 0, que é a distribuição x2 correspondente a n graus de liberdade. Sua função característica é 
(eY) = (1 Dito?) 
Diferenciando e fazendo t = 0 obtemos seu valor médio e variância 
(Y) =no0?, (Wine. (19.70) 


Tabelas dão valores para a probabilidade x? para n graus de liberdade, 


1 Se 2 
P x > yo) = mrg | qui e7920 dy , 
(210) = aT) Jy 


para o = 1 e yọ > 0. Para usar a Tabela 19.2 para o Æ 1, aumente yo = você, de modo que P(x? > voo?) 
corresponda a P(x? > vo) da Tabela 19.2. O exemplo a seguir ilustrará todo o processo. 
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Tabela 19.2 Distribuição x? 


v=0,8 v=0,7 v=0,5 v=0,3 v=0,2 v=0,1 
0,064 0,148 0,455 1,074 1,642 2,706 
0,446 0,713 1,386 2,408 3,219 4,605 
1,005 1,424 2,366 3,665 4,642 6,251 
1,649 2,195 3,357 4,878 5,989 7,119 
2,343 3,000 4,351 6,064 7,289 9,236 
3,070 3,828 5,348 7,231 8,558 10,645 


aunan elz 


Entradas são x, para as probabilidades v = P(x? > x2) = UTEN se ev/2y(n/2)-1 dy, para o = 1. 


Exemplo 19.6.1 


Vamos aplicar a função x? ao ajuste na Figura 19.8. Os pontos medidos (tj, y; + Ay;) com erros Ay; são 


(1:0,8+0.1),  (2:1,5+0,05),  (3:3+0,2). 


Para comparação, o ajuste de máxima probabilidade, Equação (19.65), resulta em 


«= 1:0,8+2-1,5+3-3 12,8 


= = 0,914. 
1+4+9 14 f 
Por sua vez, minimizar 
yj — at $ 
2 gre es 
AQ , 
a 
resulta em 
o- X 25 tilus Set 
da =" (Ay) 
ou 
DD tjyj 
_ ^i (Ay; 
= oi 
Lj au 
Em nosso caso, 
e to tos 1,505 
a= -z 22 32 =i 925 7 782 
D12 + 052 + 0,22 ) 
é dominado pelo ponto do meio com o menor erro, Ay = 0,05. A fórmula de propagação de erro 


(Equação (19.62)) nos dá a variância o? da estimativa de a, 


day? TAH 1 
=D (2) =), en = E 
j J 


t2 2 j 
j (Er TEF) D (Ay)? 


usando 
tj 
ða Tur 
no pe o 
Oy; a: TARDE 
Para nosso caso, Ca = 1/v 1.925 = 0,023, isto é, nosso parâmetro de inclinação é a = 0, 782 + 0,023. 


Para estimar a qualidade desse ajuste de a, calculamos a probabilidade x? de que os dois pontos (de controle) 
independentes caiam fora da curva de ajuste por dois desvios padrão, isto é, na média cada ponto cairia fora por 
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um desvio padrão. Aplicamos a distribuição x? ao ajuste envolvendo N = 3 pontos de dados e parâmetro r = 1, 
isto é, para n = 3 — 1 = 2 graus de liberdade. Pela Equação (19.70) a distribuição x? tem um valor médio 2 e 
uma variância 4. Uma regra prática é que x? = n para um ajuste razoavelmente bom. Então, P(x? > 2) ~ 0,496 
é lido na Tabela 19.2, em que o interpolamos entre P(x? > 1,386?) = 0,50 e P(x? > 2,408?) = 0,30, como 
segue: 


2 — 1,3862 


2,4082 — 1, 3862 
= 0,5 — 0,02 - 0,2 = 0,496. 


P(x? > 2) = P(X? > 1,386?) [P(xº > 1, 386º) — P(x? > 2, 408°)] 


Assim, a probabilidade y? de que, na média, cada ponto caia fora da curva por um desvio padrão é quase 50% e 
razoavelmente grande. E 


Nosso próximo objetivo é calcular um intervalo de confiança para o parâmetro de inclinação de nosso ajuste. 
Um intervalo de confiança para um parâmetro de alguma distribuição desconhecido a priori (por exemplo, um 
parâmetro determinado por nosso ajuste) é um intervalo que contém a não com certeza, mas com uma alta 
probabilidade p, o nível de confiança, que podemos escolher. Esse intervalo é calculado para uma amostra dada. 
Tal análise envolve a distribuição t. 


A Distribuição t de Student 


Como sempre calculamos a média aritmética de pontos medidos, consideramos agora a função amostra 


PR 
=>, Xi 


j=1 


em que admitimos que as variáveis aleatórias X; são independentes com uma distribuição normal com o mesmo 
valor médio m e a mesma variância o2. O teorema da adição para a distribuição de Gauss afirma que X, +---+X, 
tem valor médio nm e variância no2. Por conseguinte, (X1 +---+ Xn)/n é normal com valor médio m e 
variância no? /n? = 02 /n. A densidade de probabilidade da variável X — m é a distribuição de Gauss 


f(z- m) = as exp (MES, (19.71) 


20? 


O problema fundamental resolvido pela distribuição t de Student é fornecer estimativas para o valor médio m, 
quando o não é conhecido, em termos de uma função amostra cuja distribuição é independente de o. Com essa 
finalidade, definimos uma função amostra aumentada (denominada tradicionalmente) t: 


n 


EA a 3x; - 3). (19.72) 


Ê S n 


Pode-se mostrar que t e S são variáveis aleatórias independentes. Seguindo os argumentos que levam à distribuição 
xX? a densidade da variável S no denominador é dada pela distribuição gama 


n(r-1)/2,n-26-—ns?/20? 


d(s) = (19.73) 


2*7 1(15Dor- 


A probabilidade para a razão Z = X /Y de duas variáveis aleatórias independentes X, Y com densidade normal 
para f e d, como dada pelas Equações (19.71) e (19.73), é (Equação (19.40)) 


R()= [ Í / EOL. (19.74) 


portanto, a variável V = (X — m)/S tem a densidade 


o0 vn nv2s2 n(r—1)/2,n-2e—ns? /20? 
= ex sds 


r(v) = 
(0) o 0v2a 20? 2" T(2Dor-1 


se 2(,2 2 
I e7”s (v2+1)/20 sr ds. 
0 


n”/2 


~ ory T20 -D RT (27) 
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Aqui, substituímos z = s? e obtemos 
n”/2 


r(v) = or y T2” T 


— a era? +1)/20? „(n—2)/2 dz. 
(5) do 


Agora substituímos I (1/2) = yr, definimos o parâmetro 
co n(v? +1) 
— 20 


n/2 para achar 


T(n/2) 


e transformamos a integral em T(n/2)/a 


œ <v <L O. 


r(v) = V7D(25D)(v2 + 1)m/2º 


Finalmente, aumentamos essa expressão para a variável t na Equação (19.72) com a densidade (Figura 19.12) 


g(t) 


=4 -3 -2 -1 0 1 2 3 4 


Figura 19.12: Densidade de probabilidade t de Student gn (y), para n = 3. 


E T(n/2) 
Vra DE + Er? 


para a distribuição t de Student, que obviamente não depende de m ou o. A probabilidade para tı < t < t2 é dada 
pela integral 


oœ < t< o0, (19.75) 


g(t) 


T(n/2) k dt 
P = 19.7 
td E aa E Ja EDA an 


t 
n—1 


Tabela 19.3 Distribuição t de Student 


p n=1 n=2n=3n=4 n=5 
0,8 1,38 1,06 0,98 0,94 0,92 
0,9 3,08 1,89 1,64 1,53 1,48 
0,95 631 292 2,35 2,13 2,02 
0,975 12,7 430 3,18 2,78 2,57 
0,99 31,8 6,96 4,54 3,75 3,36 
0,999 318,3 22,3 10,2 7,17 5,89 
Entradas são valores C em P(C) = Kn fe (1 + E y-(n+1)/2 dt = p, n é o número de graus de liberdade. 


e P(z) = P(-00,2) é tabulada (veja a Tabela 19.3 para um exemplo). Além disso, P(o0,-00) = 1 e 
P(-z) = 1 — P(z), porque o integrando na Equação (19.76) é par em t, portanto 


T dt a dt 
oo (14 Er do qa Éorr 


n n 
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a dt a dt f dt 
É (1+ t2 yr/2 Das (1 + É yn/2 Des (1 + Er 


n—l n 


Multiplicando essa expressão pelo fator que precede a integral na Equação (19.76), temos P(—z) = 1 — P(z). No 
exemplo a seguir, mostramos como aplicar a distribuição t de Student ao nosso ajuste do Exemplo 19.6.1. 


Exemplo 19.6.2 INTERVALO DE CONFIANÇA 


Aqui queremos determinar um intervalo de confiança para a curva a no ajuste linear y = at da Figura 19.8. 

Admitimos: 

e primeiro, que os pontos da amostra (t;, yj) são aleatórios e independentes; e 

e segundo, que, para cada valor fixo t, a variável aleatória Y é normal com média u(t) = at e variância o 
independente de t. 


2 


Esses valores y; são medições da variável aleatória Y, mas nós os consideraremos medições únicas das variáveis 
aleatórias independentes Y; com a mesma distribuição normal de Y (cuja variância não conhecemos). 
Escolhemos um nível de confiança, por exemplo, p = 95%. Então, a probabilidade de Student é 


P-CGO=P(CO)-P(-C)=p=-1+2P(0), 


por conseguinte, 
1 
P(C)=5(1+9), 


usando P(-C) = 1 — P(C) e 
1 C t2 —(n+1)/2 
P(C) = (1 +) = 0975 = Kn | (1+ £) dt, 
E n 
em que K,-1 é o fator que precede a integral na Equação (19.76). Agora determinamos uma solução C = 4,3 
da Tabela 19.3 da distribuição t de Student, sendo n = N — r = 3 — 1 = 2 o número de graus de liberdade, 


observando que (1 + p)/2 corresponde a p na Tabela 19.3. 
Então, calculamos A = Coa/ VN para tamanho de amostra N = 3. O intervalo de confiança é dado por 


a—A<a<a+A, em p = 95% no intervalo de confiança. 


Pela análise x2 do Exemplo 17.6.1, usamos a inclinação a = 0.782 e variância o2 = 0,0232, portanto A = 


4, o = (0,057, e o intervalo de confiança é determinado por a— A = 0, 782— 0,057 = 0,725, a+ A = 0,839, 
ou 


0,725 < a < 0,839 em 95% no intervalo de confiança. 


Comparando com ga, a incerteza de a aumentou devido ao alto nível de confiança. Um exame da Tabela 19.3 
mostra que um decréscimo no nível de confiança, p, reduz o intervalo de incerteza e que aumentar o número de 
graus de liberdade, n, também reduzirá a faixa de incerteza. E 


Exercícios 
19.6.1 Seja AA o erro de uma medição de A etc. Use propagação de erro para mostrar que 


8 (8) + (88) 


vale para o produto C = AB e a razão O = A/B. 


19.6.2 Ache o valor médio e o desvio padrão da amostra de medições xı = 6, 0, £2 = 6, 5, £3 = 5,9, £5 = 
6,2. Se o ponto zę = 6,1 for adicionado à amostra, como essa mudança afeta o valor médio e o 
desvio padrão? 
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19.6.3 (a) Efetue uma análise x2 do ajuste do caso b na Figura 19.9 admitindo os mesmos erros para os t;, 
At; = Ay;, que os y; usados na análise de x2 do ajuste na Figura 19.8. (b) Determine o intervalo 
de confiança no nível de confiança 95%. 


19.6.4 Se £1, £2,..., £n são uma amostra de medições com valor médio dado pela média aritmética z e 
as correspondentes variáveis aleatórias X; que assumem os valores x; com a mesma probabilidade 
são independentes e têm valor médio u e variância o?, então mostre que (7) = ye o2(z) = 02/n. 
Seo? = 4 $` (x; — X)?é a variância da amostra, mostre que (5?) = 2192, 
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exercícios, 527-529 
forma de contínuo, 526-527 
normalização, 525 
potencial eletrostático em um cilindro oco, 526 
séries de Bessel, 525 
relações de recorrência, 511 
valores assintóticos, 546 
zeros, 515 
bifurcações em sistemas dinâmicos, 837-838 
em garfo, 821, 823, 836, 840 
Hopf, 836, 837-838, 840 
bifurcadas, 821 


buraco negro, caminho ótico perto de horizonte de evento de, 790-791 


C 
cálculo de resíduos, 345-365, veja também integrais definidas 
exercícios, 359-365 
expansão de pólo de funções meromórficas, 349 
expansão de produto de funções inteiras, 350-351 
lema de Jordan, 353-355 


teorema do resíduo, 345 
valor principal de Cauchy, 346-349 
visão geral, 345 
cálculo de variações, 787-817 
aplicações da equação de Euler, 792-798 
exercícios, 796-798 
linha reta, 792-794 
película de sabão, 793-794 
película de sabão — área mínima, 794-796 
dependente e uma variável independente, 787-792 
caminho ótico perto do horizonte de eventos de um buraco 
negro, 790-791 
conceito de variação, 787-790 
exercícios, 792 
formas alternativas de equações de Euler, 791 
variáveis dependentes omitidas, 791-792 
diversas variáveis dependentes e independentes, 803-804 
exercícios, 804 
relação com a física, 804 
diversas variáveis dependentes, 798-803 
equação de Laplace, 803 
exercícios, 800-801 
partícula em movimento — coordenadas cartesianas, 800 
partícula em movimento — coordenadas cilíndricas circulares, 
800 
princípio de Hamilton, 799-800 
diversas variáveis independentes, exercícios, 803 
multiplicadores lagrangianos, 804-808 
exercícios, 806-808 
partícula dentro de uma caixa, 805-806 
reator nuclear cilíndrico, 806 
restrições, 804-813 
superfície de revolução, 794 
técnica variacional de Rayleigh-Ritz, 814-817 
autofunção de estado fundamental, 814 
corda vibratória, 815 
equação de Sturm-Liouville, 814 
exercícios, 815-817 
utilizações de, 787 
variação com restrições, 808-813 
desprendendo-se da superfície de um tronco, 810-811 
equação de onda de Schrödinger, 811-812 
equações lagrangianas, 809 
exercícios, 812-813 
pêndulo simples, 809-810 
calibre de Lorentz, 40 
caminho óptico perto do horizonte de evento de um buraco negro, 
790-791 
campo constante B potenciais vetoriais de, 34 
campo de força central, 31, 34-36 
campo de indução magnética de circuito de corrente, 588-592 
campo gravitacional da Terra, 573 
campo vetorial, 6 
caos em sistemas dinâmicos, 838-840 
características, 406-408 
caráter, 140, 222-223 
carga total dentro de esfera, 308-312 
cargas elétricas dentro de esferas, 69 
catenóide, catenária de revolução, 794 
causalidade, 368 
cavidade ressonante, 516-518 
cavidades, cilíndricas, 516-518 
CDQ (cromodinâmica quântica), 197 
centro ou ciclo, 834-836 
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cinemática e dinâmica em espaço-tempo de Minkowski, 213-215 
circuito RL, 414-415 
classes e caráter, 222-223 
coeficiente binomial, 270 
coeficiente de regressão, 789-790 
coeficientes de Clebsch-Gordan, 202-205, 607 
coeficientes de expansão, 497 
coeficientes principais de se1,698-701 
coeficientes principais para ceo, 701-703 
completude de autofunções 
de Hilbert-Schmidt: de equações integrais, 782-784 
de séries de série de Fourier: de autofunções de Sturm-Liouville, 
490-491 
componentes cartesianas, 4 
componentes esféricas, 205-206 
comportamento global, 829-836 
comutador, 137, 171, 175, 189, 192, 199, 200 
comutativa, 1 
condição de ortogonalidade, 8, 151 
condições bidimensionais para matrizes ortogonais, 151-152 
condições de Cauchy-Riemann, 312-316 
exercícios, 314-316 
funções analíticas, 314-316 
2*,314 
22,314 
visão geral, 312-314 
condições de cruzamento, 366 
condições de Dirichlet, 409, 667 
núcleo, 689 
condições de fronteira, 409 
anel de carga, 575 
campo magnético de circuito de corrente, 588-592 
Cauchy, 409 
cilindro oco, 526 
Dirichlet, 409 
esfera em campo elétrico uniforme, 574 
guia de onda, cabo coaxial, 532 
Neumann, 409 
teoria de Sturm-Liouville, 473-474 
conectada, simplesmente ou multiplamente, 46, 74, 317, 320, 322, 
329 
conjugação, complexa, 308-309 
conjunto de Julia, 824 
conjunto de Mandelbrot, 824 
conjunto vazio, 843 
constante de campo magnético B (campo), 34 
constante de Catalan, 292, 387 
constante de Euler-Mascheroni, 251 
constante de Madelung, 264 
constantes de estrutura, 188, 190, 196-197 
continuação analítica, 327-330 
continuidade de séries de potências, 276 
contorno de integração, pólo simples sobre, 354-355 
contração de Lorentz-Fitzgerald, 114 
contração, 107-108 
convenção da soma de Einstein, 106 
lei da adição da velocidade, 215, 220 
convenção do somatório, 105-106, 107 
convenções de fase de Condon-Shortley, 205 
convergência absoluta, 259-260, 265, 275 
convergência condicional, 259 
convergência de série infinita, 245, 684 
absoluta, 259-260, 265, 684 


de produto infinito, 301 
de séries de potências, 275 
e aproximações racionais, 262 
melhoria de, e números de Bernoulli, 292 
taxa, 254, 262 
testes, 248-258, veja também teste da integral de Cauchy 
(Maclaurin) 
aproximação de soma parcial, 296 
comparação, 248 
de Gauss, 253, 271 
de Kummer, 251-252 
de Raabe, 253 
exercícios, 255-258 
melhoria de, 254-258 
visão geral, 248 
uniforme e não-uniforme, 265 
convergência não-uniforme, 265 
convergência uniforme, 265, 275 
convergência, taxa de, 254, 262 
coordenadas cartesianas, 418-419 
vetores unitários, 4 
coordenadas cilíndricas circulares, 89-95 
exercícios, 93-95 
lei da área para movimento planetário, 90-92 
termo de Navier-Stokes, 92 
visão geral, 89-90 
coordenadas cilíndricas circulares, 419-420 
expansão, 454 
coordenadas cilíndricas, 80 
coordenadas cilíndricas, circulares, veja coordenadas cilíndricas 
circulares 
coordenadas curvas e vetores, 80-103, veja também coordenadas 
cilíndricas circulares; coordenadas ortogonais; coordenadas 
polares esféricas 
operadores diferenciais, 85-88 
divergência, 86-87 
rotacional, 87 
exercícios, 88 
gradiente, 85 
visão geral, 85 
sistemas de coordenadas especiais, 88-103 
visão geral 80 
coordenadas curvilíneas, 80-82, 83, 86, 87 
coordenadas esféricas, equação de Helmholtz, 548 
coordenadas ortogonais 
em R3, 80-85 
exercícios, 84-85 
jacobianos para coordenadas polares, 84 
visão geral, 80-83 
laplaciano em, 240-241 
coordenadas polares esféricas, 96-103, 420-423 
exercícios, 99-103 
expansão, 452-453 
V, V-, V x para força central, 99 
potencial vetorial magnético, 99 
vetores unitários, 96 
visão geral, 96-98 
coordenadas polares, jacobianos para, 84-85, veja também 
coordenadas polares esféricas 
coordenadas, veja também coordenadas cilíndricas circulares; 
coordenadas curvadas e vetores; coordenadas ortogonais; 
coordenadas polares esféricas 
curvilíneas, 81, 85, 86, 87 
divergência de vetor coordenado, 31 
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eixos, rotação de, veja rotações 
laplaciano em ortogonal, 240-241 
rotação de, 151 
corda vibratória, 815 
corda vibratória, lagrangiano de uma, 803, 813 
correlação, 851 
corte de ramo (linha de corte), 309 
co-senos 
co-senos direcionais (matrizes ortogonais), 4, 148-149, 152-153 
direção, 148-149 
expansão assintótica, 297-298 
funções de produtos infinitos, 301-302 
integrais em séries assintóticas, 297-298 
integral de, no denominador, 352 
integral, 297 
lei de, 13,91, 563 
lei de, teorema, 13 
produto infinito, 302, 350 
representação hipergeométrica confluente, 656 
teorema, 13 
transformada de co-seno, 710-711 
covarância, 852 
covariância de equações de Maxwell, de Lorentz, veja covariância de 
Lorentz de equações de Maxwell 
covariância de Lorentz de equações de Maxwell, 215-221 
exercícios, 219-221 
invariante eletromagnético, 219 
transformação de E e B, 218 
visão geral, 215-217 
critério de Cauchy, 245 
critério de Leibniz, 258 
fórmula para diferenciar um produto, 583 
fórmula para diferenciar uma integral, 445, 587 
critério, Leibniz, 258 
cromodinâmica quântica (QCD), 197 
curvas, ajuste a dados, 866-869 


D 
d'alembertiano, 109 
decomposição espectral, 166, 170, 479 
definição de vetor, 6 
representação de, 6-7 
definições integrais de gradiente, divergência e espiral, 44-45 
degeneração, de equação de onda de Schrödinger, 481 
degradação káon, 214-215 
degradação radioativa, 740-741, 858, 859, 861 
degradação, káon, 214-215 
Del (V), 33, 34 
aplicações sucessivas de, 38-42 
equação de onda eletromagnética, 40-41 
exercícios, 41-42 
laplaciano de potencial, 39 
visão geral, 38-39 
para força central, 98 
delta de Kronecker, 8, 106 
densidade tensorial, veja pseudotensores 
dependência azimutal — ortogonalidade, 595 
dependência de ângulo polar, 596 
derivada covariante, 116, 120 
derivada exterior, 234-235 
derivada invariante de calibre, 59 
teoria, 196 
transformação, 59 
derivadas, 322-323, veja derivada exterior 


covariante, 120 
covariante de calibre, 59 
descontinuidades, comportamento de, 671 
desigualdade de Bessel, 491-492 
desigualdade de Cauchy, 324 
desigualdade de Schwarz, 492-494 
generalizada, 499 
desigualdades de triângulo, 307 
deslocamento Doppler, 273 
deslocamento, 121 
desvio padrão de medidas,850-852 
desvio padrão, 849, 866 
determinante de Slater, 208 
determinante wronskiano, 438 
determinantes, 126-182 
anti-simetria, 128-131 
eliminação de Gauss, 129-131 
eliminação de Gauss-Jordan, inversão, 140-141 
visão geral, 128-129 
dependência linear de vetores, 131-132 
desenvolvimento laplaciano por menores, 127-128 
equações lineares homogêneas, 126 
equações lineares não-homogêneas, 126-127 
exercícios, 132-134 
procedimento de Gram-Schmidt, 132 
vetores por ortogonalização, 132 
visão geral, 132 
teorema do produto, 137 
equação secular, 165 
representação de um produto vetorial, 16 
solução de um conjunto de equações homogêneas, 126 
solução de um conjunto de equações não-homogêneas, 126-127 
visão geral, 126 
dêuteron, 472-473 
diagrama de Argand, 307 
diagrama de peso, 194-196, 197, 201 
diagrama de raiz, 200 
diferenciação de séries de potências, 276 
diferenciação, 684-685 
diferenciais, exatas, veja termodinâmica 
difração de Fraunhofer, função de Bessel, 514-515 
difração, 514-515, 772 
dimensão 
contagem de caixas, 823 
Hausdorff, 823 
Kolmogorov, 823 
dipólos, energia de interação, dipólo magnético, campos de radiação, 
dispersão anômala, 757 
dispersão da mecânica quântica, 355-356 
dispersão óptica, 367 
dissipação, 836-837 
distribuição t de Student, 872-874 
distribuição (x?) quadrado, 869-871 
distribuição binomial de probabilidade, 857 
distribuição binomial, 857-859 
distribuição de Poisson, 859-861 
distribuição gama, 869 
distribuição normal de Gauss, 784-786 
distributiva, 10 
divergência, V, 30-33 
como operador derivado de tensor, 123-124 
como operador vetorial diferencial, 86-87 
coordenadas cilíndricas, 89-95 
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coordenadas curvilíneas, 86 
coordenadas, cartesianas, 4-6 
de vetores de coordenadas, 31 
definições integrais de gradiente, espiral, e, 44-45 
do campo de força central, 31 
exercícios, 33 

integração por partes de, 31 
interpretação física, 32-33 
polar esférica, 96-103 
solenoidal, 33 

visão geral, 30-31 


E 
EDOs auto-adjuntas, 469-478 
autofunções, autovalores, 471-472 
condições de fronteira, 473-474 
dêuteron, 472-473 
equação de Legendre, 472 
intervalo de integração [a, b], 474 
operadores Hermitianos em mecânica quântica, 475 
operadores Hermitianos, 475 
EDPs elípticas, 406 
EDPs hiperbólicas, 406 
EDPs parabólicas, 406 
efeito borboleta, 818 
efeito de Stark, 435, 641 
eixo de simetria duplo, 223-225 
eixo de simetria triplo, 225-227 
eixo principal, 164 
eixo, coordenadas, 4, 6-9, 148-151 
eixos, veja rotações; simetria 
eletromagnéticas, 219 
eletrostática, base física, 560 
eliminação de Gauss, 129-131 
equação diferencial de Gauss, 237-238, 242, 464-465, 467 
equação diferencial hipergeométrica, 435, 650-652, 660 
eliminação, veja determinantes 
energia 
potencial, 235 
relativista, 270-271 
energia de ponto zero,553, 625 
EPD de fluxo de calor, 718 
equação angular de Mathieu, 660 
equação da fonte pontual, 500 
equação da idade de Fermi, 719 
Equação de Abel, 771 
equação de Bessel, 745-746 
equação de continuidade, 32-33 
equação de difusão de Helmholtz, 405 
equação de difusão de onda (equação de difusão de Helmholtz), 405 
equação de difusão dependente do tempo, 406 
equação de difusão independente do tempo, 406 
equação de difusão, veja equações diferenciais, EDP de fluxo de calor 
equação de Euler, 789 
aplicações de, 792-798 
linha reta, 792-793 
película de sabão, 793-794 
película de sabão — área mínima, 794-796 
formas alternativas de, 791 
equação de Fredholm, 763-764 
equação de Hamilton-Jacobi, 407 
equação de Helmholtz, 420, 421, 463 
coordenadas esféricas, 548 
função de Bessel, 516-517, 548 


função de Green, 500 
equação de Klein-Gordon, 405 
equação de Korteweg-deVries, 409 
equação de Kummer, veja equação hipergeométrica confluente, teste 
de Kummer 
equação de Laplace, 404, 803 
funções de Bessel, 525 
polinômios de Legendre, 574, 575 
soluções, 39, 75, 335, 342, 407, 423 
equação de Legendre, 472 
forma diferencial, 568 
equação de Legendre, equação de Maxwell, 589 
forma auto-adjunta, 470, 472 
equação de Legendre 
forma auto-adjunta, 470, 583 
equação de Legendre 
soluções de série de, 610-611 
equação de Mathieu 
angular, 660 
modificada, 660 
radial, 660 
equação de onda de Schrödinger, 471 
átomo de hidrogênio, 638 
degeneração de, 482 
equação de onda de Schrödinger, 59, 405, 811-812 
derivações variacionais, 811-812 
representação de espaço de momento, 725 
equação de onda eletromagnética, 40-41 
equação de onda, 717 
derivação da equação de Maxwell, 40 
dispersão anômala, 757 
solução da transformada de Fourier, 717 
solução da transformada de Laplace, 717 
equação de onda, eletromagnética, 40-41 
equação de Poisson, 405 
e lei de Gauss, 63-65 
função de Green, 505-506 
equação de Riccati, 826 
equação de Volterra, 763 
equação diferencial de Bessel, 512-513, 517 
forma auto-adjunta, 524 
equação diferencial de Chebyshev, 422 
equação diferencial não-homogênea ordinária (EDO), de Green 
soluções de função, 501 
equação do oscilador linear, 766-767 
equação geodésica, 121 
equação hipergeométrica 
formas alternativas, 651, 654 
segunda solução independente, 651 
singularidades, 426, 650, 654, 655, 660 
equação indicial, 428 
equação integral não-nomogênea, 783-784 
equação modificada de Mathieu, 660 
equação não-homogênea - função de Green, 447-461 
expansão de coordenadas cilíndricas circulares, 454-455 
expansão de coordenadas polares esféricas, 452-453 
forma de funções de Green, 450-452 
simetria de função de Green, 449-450 
teorema da adição de polinômios de Legendre, 453-454 
equação radial de Mathieu, 660 
equação secular, 165 
equacões de autovalor auto-adjuntas, 449 
equações de campo, 110 
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equações de Lagrange, 809 
equações de Maxwell, 40, 215, 241-244 
co-variância de Lorentz de, 215-221 
exercícios, 219-221 
invariantes eletromagnéticas, 219 
transformação de E e B, 
visão geral, 215-218 
da lei de Gauss, 41 
derivação de equação de ondas, 40-41 
equação de Legendre, 589 
lei de Oersted, 40-41 
transformação dual, 220 
equações de Navier-Stokes, 92 
equações diferenciais autônomas, 827-829 
equações diferenciais de primeira ordem, 410-418 
EDOs lineares de primeira ordem, 413-415 
equações diferenciais exatas, 412-413 
variáveis separáveis, 411 
equações diferenciais exatas, 412-413 
equações diferenciais lineares não-nomogêneas, 126-127 
equações diferenciais não-lineares (EDNs), 825 
bifurcações em sistemas dinâmicos, 837-838 
caos em sistemas dinâmicos, 838-840 
centro ou ciclo, 834-835 


comportamento local e global em número maior de dimensões, 829 


dissipação em sistemas dinâmicos, 836-837 
equações de Bernoulli e Riccati, 826 
equações diferenciais autônomas, 827-829 
ponto de sela, 830-832 
ponto fixo espiral, 833-834 
rotas para o caos em sistemas dinâmicos, 840 
singularidades fixas e móveis, soluções especiais, 826 
sorvedouro estável, 830 
equações diferenciais ordinárias (EDOs), lineares de primeira ordem, 
413-415 
equações diferenciais parciais (EDPs), 404-410 
bicaracterísticas de, 406 
características de, 406-408 
classes de, 406-408 
condições de fronteira, 409-410 
elíptica, 406 
exemplos de, 404-406 
funções harmônicas, 406 
hiperbólicas, 406 
introdução, 404 
inversão de, 718-719 
não-linear, 409 
parabólica, 406 
equações diferenciais, veja termodinâmica 
equações diferenciais, 404-468, 567-568 
EDP de fluxo de calor ou difusão, 462-468 
condição de fronteira especial, novamente, 465-466 
condição de fronteira específica, 462-463 
fluxo de calor esfericamente simétrico, 466-467 
soluções alternativas, 464-465 
equação não-nomogênea — função de Green, 447-461 
dispersão da mecânica quântica — função de Green, 456-458 
dispersão da mecânica quântica — solução de série de 
Neumann, 455 
exercícios, 458-461 
expansão de coordenadas cilíndricas circulares, 21, 454 
expansão de coordenadas polares esféricas, 452-453 
forma de funções de Green, 450-452 


simetria da função de Green, 449-450 
teorema da adição de polinômio de Legendre, 453-454 
equações diferenciais de primeira ordem, 410-418 
circuito RL, 415 
EDOs lineares de primeira ordem, 413-415 
equações diferenciais exatas, 412-413 
exercícios, 415-418 
não-lineares, 825-836 
pára-quedista, 411-414 
variáveis separáveis, 411 
equações diferenciais parciais, 404-410 
classes de EDPs e características, 406-408 
condições de fronteira, 409-410 
EDPs não-lineares, 409 
exemplos de, 404-405 
introdução, 404 
homogênea, 404, 414-415, 427 
independência linear de soluções 
forma de série da segunda solução, 440-442 
segunda solução, 439-440 
pontos singulares, 425-426 
segunda solução, 433-437 
dependência linear, 438-439 
exercícios, 443-447 
independência linear de soluções, 4377-438 
independência linear, 438 
segunda solução da equação de Bessel, 442-443 
segunda solução para a equação do oscilador linear, 440 
separação de variáveis, 418-425 
coordenadas cartesianas, 418-419 
coordenadas cilíndricas circulares, 419-420 
coordenadas polares esféricas, 420-423 
exercícios, 423-425 
solução particular, 414, 427 
soluções de série — método de Frobenius, 427-437 
exercícios, 433-437 
expansão em torno de xo, 430 
limitações da abordagem de série — equação de Bessel, 430-431 
simetria de soluções, 430 
singularidades regulares e irregulares, 432 
teorema de Fuchs, 433 
teorema de Fuchs, 433 
termo logarítmico da segunda solução, 441, 529 


equações homogêneas, 126, 427 
equações integrais, 763-786 


e série de Fourier para funções de Mathieu, 695-698 
equações de Fredholm, 763, 764, 767, 769, 772, 7175-7717, 781-783 
equações de Volterra, 751, 763, 766-767, 774 
introdução, 763-768 
definições, 763 
equação do oscilador linear, 766-767 
exercícios, 767 
representação de momento em mecânica quântica, 764 
transformação de uma equação diferencial em uma equação 
integral, 765-766 
série de Neumann, núcleos separáveis (degenerados), 772-781 
exercícios, 778-781 
núcleo separável, 775 
série de Neumann, 772-773 
solução de série de Neumann, 774 
solução numérica, 776-777 
teoria de Hilbert-Schmidt, 781-786 
autofunções ortogonais, 781-783 
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equação integral não-homogênea, 783-784 distribuição t de Student, 872-874 
exercícios, 784-786 intervalo de confiança, 874 
simetrização de núcleos, 781 propagação de erro, 865-866 
transformadas integrais, função geradoras, 768-772 expansão binomial, 858 
equação generalizada de Abel, teorema da convolução, 769 expansão de funções, série de Legendre, 572-573 
exercícios, 770-772 expansão de Jacobi-Anger, 519 
funções geratrizes, 770 expansão de Laurent, 325-332, 353 
solução de transformada de Fourier, 769 continuação analítica, 327-328 
equações lagrangianas, 809 exercícios, 331 
equações lineares expansão de Taylor, 325-326 
homogêneas, 126 princípio de reflexão de Schwarz, 326-327 
não-homogêneas, 126 expansão de Maclaurin, cálculo de série, 387 
equações, veja também equações lineares; equações de Maxwell; expansão de pólo de funções meromórficas, 349 
equação de Poisson expansão de Stirling, 375 
de movimento e campo, 110 expansão de Taylor, 267-275, 325-326 
escalares, 6, 103 exercícios, 271-275 
multiplicação de matrizes por, 136 teorema binomial, 270-271 
potenciais, 53-56 energia relativista, 270-271 
centrífuga, 56 teorema de Maclaurin, 269-270 
gravitacional, 56 função exponencial, 269 
visão geral, 53-56 logaritmo, 269 
produtos, 10-14 visão geral, 269 
exercícios, 13-14 variáveis múltiplas, 271 
invariância sob rotações, 12-14 visão geral, 267-268 
tripla, 20-21 expansão multipolar eletrostática, 333 
visão geral, 10-12 expansão por frações parciais, 733-734 
esfera em campo elétrico uniforme, 574-575 expansão vetorial, 563-564 
esferas, carga total dentro de, 69 expansão WKB, 299 
espacial, vetor, veja vetores expansão, veja também expansão de Laurent; expansão de Taylor 
espaço amostral, 842 de série, 282-283 
espaço de fase, 69, 818, 827 pólo, de funções meromórficas, 349 
espaço de Hilbert, 6, 404, 475, 482, 497, 670 produto, de função inteira, 350-351 
espaço de Minkowski, 105, 211-212 expansões assintóticas, 544-548 
espaço e grupos de pontos, cristalográfico, 227-228 expansões de Fourier das funções de Mathieu, 695-703 
espaço vetorial, espaço linear, 6, 9, 131-132, 134, 158, 166, 187-188, coeficientes principais de conjunto se1, 698-701 
239, 481-482, 486, 490-491, 494, 496-497, 669 coeficientes principais para ceo, 701-703 
espaços vetoriais, completude, 494-497 equações integrais e séries de Fourier para funções de Mathieu, 
espaço-tempo de Minkowski, veja cinemática e dinâmica em 695-698 
espaço-tempo de Minkowski expoentes de Lyapunov, 822-823 
espinores, 107 exponencial de matriz diagonal, 170-171 
exercícios, 107 
visão geral, 107 F 
espiral, Vx, 34-38 faixa crítica, 679 
campo de força central, 34-36 fase de um número complexo, 309 
como operador vetorial diferencial, 87 fase de uma função complexa, 309 
definições integrais de gradiente, divergência e, 44-45 fechamento de função de Bessel, 187, 526 
exercícios, 37-38 fechamento de harmônicos esféricos, 597, 599 
gradiente de produto vetorial, 36 fenômeno de Gibbs, 671, 688-691 
integração por partes de, 36-37 cálculo do aumento momentâneo, 690-691 
operador derivado como tensor, 124-125 onda quadrada, 689-690 
potencial vetorial de campo B constante, 34 somatório de série, 689 
visão geral, 34 fluxo magnético através de uma superfície orientada, 233 
espiral, V x força central, 90 
campo de força central força como gradiente de um potencial, 29 
em coordenadas cilíndricas circulares, 91 força conservativa, 27, 53 
em coordenadas curvilíneas, 87-88 força impulsiva, 739 
em coordenadas polares esféricas, 98 forma algébrica, 306 
irrotacional, 36 forma de contínuo, 526-527 
estado ligado, 473 forma de série, 540 
estatística de Bose-Einstein, 808, 846 de segunda solução, 440-441 
estatística de Fermi-Dirac, 808, 846 forma do produto infinito de Weierstrass der (2), 377 
estatística, 864 forma integral, funções de Neumann, 530 
ajustando curvas a dados, 866-869 forma trigonométrica, 646 


distribuição x?2, 869, 871 formas assintóticas 
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da função de Hankel, 373-374 
da função fatorial r(1 + s), 374 
formas diferenciais, 231-243, veja também retornos 
1- formas, 232 
2- formas, 232-233 
3- formas, 233 
derivada exterior, 234-235 
equação de Legendre, 568 
exercícios, 242-244 
operador * de Hodge, 239-243 
equações de Maxwell, 241-244 
laplaciano em coordenadas ortogonais, 240-241 
produto cruzado de vetores, 240 
visão geral, 239-240 
teorema de Stokes sobre, 239 
visão geral, 231-232 
formas exponenciais, 357-365 
função fatorial, 357-358 
números de Bernoulli, 358-359 
fórmula de De Moivre, 352 
fórmula de duplicação de Legendre, 380 
fórmula de duplicação de Legendre, derivação de, 395 
fórmula de duplicação para funções fatoriais, veja fórmula de 
duplicação de Legendre 
fórmula de integração de Euler-Maclaurin, 288-289 
fórmula de Rodrigues, 580 
polinômios de Laguerre, 635 
associada, 580, 637 
fórmula de Wallis, 302 
fórmula do traço, 170 
de Gutzwiller, 680 
fórmula tripla de Hermite, 626 
fórmulas de Rayleigh 552 
fórmulas wronskianas, 531 
ausência de terceira solução, 443, 445 
função de Green, construção de, 447, 531 
funções de Bessel, 531-532 
funções de Bessel, esféricas, 454, 546 
funções de Chebyshev, 439-440, 446 
funções hipergeométricas confluentes, 657 
independência linear de funções, 437-438, 502, 531 
segunda solução de equações diferenciais, 440-443 
soluções de equação diferencial auto-adjunta, 531 
fractais, 823-824 
função beta, 393-398 
convolução de Laplace, 752 
derivação da forma de duplicação de Legendre, 394-395 
incompleta, 395 
integrais definidas, forma alternativa, 394 
verificação da relação rar/sen ma, 394 
função de Green, 499-509 
análogo eletrostático, 447, 502 
autofunção, equação de autovalor, 503-504 
construção de, duas dimenções, 451 
construção de, tres dimenções, 451 
construção de, uma dimensão, 452, 501-502, 506 
e função delta de Dirac, 505-506 
equação de Helmholtz, 500 
equação de Poisson, 505-506 
equação não-homogênea, 447-461 
expansão de autofunção, 499-509 
forma de, 450-452 
Helmholtz, 451 


Helmholtz modificada, 451 
integral — equação diferencial, 502-503 
operador de Laplace, 451 
expansão cilíndrica circular, 454-458 
expansão polar esférica, 451-452 
oscilador linear, 505 
simetria de, 449-450 
unidimensional, 500-502 
função de Laplace, 451 
função de transferência, 729 
função delta de Dirac, veja função delta, Dirac 
função delta, Dirac, 64-67, 505-506, 738-739 
carga total dentro da esfera, 69 
derivação, 709-710 
em coordenadas cilíndricas circulares, 454 
em coordenadas polares esféricas, 64, 452 
espaço de fase, 69 
exercícios, 71-74 
expansão de autofunção, 69-70, 491 
fonte pontual, 69, 448 
força impulsiva, 739 
função de Green e, 448-461 
integral de Fourier, 70 
representação de Bessel, 708 
representação de Fourier, 70 
representação por funções ortogonais, 69-70 
representações de seno, co-seno, 714 
representações integrais para, 70 
sequências, 65, 67 
teoria de distribuições, 67 
teoria quântica, 723-728 
transformada de Laplace, 739 
visão geral, 64-68 
função escalonada unitária de Heaviside, 72, 755 
função escalonada, 734 
função exponencial, do teorema de Maclaurin, 269 
Função fatorial D(1 + s) 
argumento complexo, 377-383 
expansão de Maclaurin, 387 
forma assintótica de, 374 
fórmula assintótica de inclinações acentuadas, 374-375 
fórmula de duplicação de Legendre, 380 
função digama, 386 
funções poligama, 386-387 
integrais de contorno, 381 
notação de fatorial duplo, 381 
produto infinito, 378 
relação funcional gama, 380 
representação integral Euler, 377-378 
série (fórmula) de Stirling, 390-391 
função gama incompleta, 295-297 
relações de recorrência, 302, 387 
representação hipergeométrica confluente, 377, 654 
função gama, veja também função fatorial, 377-403 
de produto infinito, 301-302 
definições, propriedades simples, 377-386 
exercícios, 383-386 
integral definida (Euler), 377-378 
limite infinito (Euler), 377 
notação de fatorial duplo, 381 
notação fatorial, 380-381 
produto infinito (Weierstrass), 378-380 
representação integral, 381-382 
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função beta, 393-398 
derivação da fórmula de duplicação de Legendre, 394-395 
exercícios, 395-398 
função beta incompleta, 395 
integrais definidas, formas alternativas, 394 
verificação da razão ma:/sen ma, 394 
funções digama e poligama, 386-390 
constante de Catalan, 387 
exercícios, 388-390 
expansão de Maclaurin, cálculo, 387 
função poligama, 386-387 
funções digama, 387 
somatório de série, 387 
funções gama incompletas e funções relacionadas, 398-403 
exercícios, 400-403 
integrais de erro, 400 
integral exponencial, 398-400 
série de Stirling, 390-393 
derivação da fórmula de integração de Euler-Maclaurin, 390 
exercícios, 391-393 
série de Stirling, 391 
função geradora, 560-566, 641-642, 769-770 
base física — eletrostática, 560 
expansão vetorial, 563-564 
extensão para polinômios ultra-esféricos, 564 
funções associadas de Legendre, 582-592, 596 
funções de Bessel, modificadas, 537, 539-542, 546-547, 655 
multipólos elétricos lineares, 562-563 
números de Bernoulli, 286-295, 358-359, 391 
para ordem inteira, 510-511 
polinomiais associadas de Laguerre, 471, 636-639 
polinômios associados de Legendre, 584 
Polinômios de Chebyshev, 642-650 
polinômios de Hermite, 618-628 
polinômios de Laguerre, 488, 633-636, 638-639 
polinômios de Legendre, 560-562 
polinômios ultra-esféricos, 564 
polinômios, Bernoulli, 288 
função zeta de Riemann, 251, 254-258 
avaliação da série de Fourier, 251 
tabela de valores, 290 
e números de Bernoulli, 290-292 
séries infinitas, 677-680 
função zeta, veja função zeta de Riemann 
funções, 618-666, veja também funções analíticas 
de matrizes, 169-171 
de variável complexa, 309-312 
exponencial, de teorema de Maclaurin, 269 
fatorial, 357-358 
funções de Hermite, 618-633 
aplicações das fórmulas de produto, 628-629 
exercícios, 629-633 
expansão direta de produtos de polinômios de Hermite, 627-628 
fórmula tripla de Hermite, 626 
funções geradoras — polinomiais de Hermite, 618-619 
ortogonalidade, 621 
oscilador harmônico simples da mecânica quântica, 622-625 
relações de recorrência, 619 
representação de Rodrigues,620-621 
representações alternativas, 620 
funções de Laguerre, 633-642 
átomo de hidrogênio, 638-639 
equação diferencial — polinomiais de Laguerre, 633-636 


exercícios, 639-642 
polinomiais associadas de Laguerre, 636-638 
funções de Mathieu, 658-665 
exercícios, 665 
funções radiais de Mathieu, 661-665 
pêndulo quântico, 661 
propriedades gerais de funções de Mathieu, 661 
separação de variáveis em coordenadas elípticas, 658-659 
tambor elípitco, 660 
funções hipergeométricas confluentes, 653-658 
casos diversos, 655 
exercícios, 656-658 
funções de Bessel e funções modificadas de Bessel, 655 
funções de Hermite, 655 
representações integrais, 654-655 
funções hipergeométricas, 650-653 
exercícios, 652-653 
funções contíguas relações, 651 
representações hipergeométricas, 652 
inteiro, 314, 350-351 
meromórfica, 349-350, 362 
multivalente e pontos de ramificação, 338-340 
polinomiais de Chebyshev, 642-650 
exercícios, 647-650 
forma trigonométrica, 645 
funções geradoras, 642 
ortogonalidade, 647 
relações de recorrência — derivadas, 645 
tipo I, 642-645 
tipo II, 642 
rotação de, 190 
série de, 264-267 
exercícios, 267 
teste M de Weierstrass, 265 
teste de Abel, 266 
uniforme e não-uniforme convergência, 265 
visão geral, 265 
funções Qn (x) da segunda espécie, 611-612 
funções analíticas, 314-316 
2*,314 
22,314 
funções de Clausen, 688 
funções de equação associada de Legendre, veja equação de 
Legendre, funções polinomiais 
funções de Hankel e equações de movimento de Lagrange, 373-374, 
534-538 
definição, pela função de Neumann, 534-535 
definições, 534-535 
esféricas, 550-551 
expansão de série, 534, 540 
formas assintóticas, 373-374, 546 
fórmulas wronskianas, 535 
ondas progressivas cilíndricas, 535 
representação de integral de contorno das funções de Hankel, 
536-537 
funções de Hermite, 618-633, 655 
aplicações das fórmulas de produto, 628-629 
construção de Gram-Schmidt, 484-485 
expansão direta de produtos de polinômios de Hermite, 627-628 
fórmula tripla de Hermite, 626 
funções geradoras — polinomiais de Hermite, 618 
ortogonalidade, 621 
oscilador harmônico simples da mecânica quântica, 622-625 
relações de recorrência, 619 
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representação de Rodrigues, 620-621 
representação hipergeométrica confluente, 655 
representações alternativas, 620 
funções de Laguerre, 633-642 
átomo de hidrogênio, 638-639 
equação diferencial - polinômios de Laguerre, 633-636 
polinômios associados de Laguerre, 636-638 
funções de Legendre, 560-616 
associada, 584 
definições alternativas de polinômios de Legendre, 580-582 
exercícios, 581-582 
fórmula de Rodrigues, 580 
integral de Schlaefli, 580-581 
função geradora, 560-566 
base física — eletrostática, 560 
exercícios, 564-566 
expansão vetorial, 563-564 
extensão para polinômios ultra-esféricos, 564 
multipolos elétricos lineares, 562-563 
polinômios de Legendre, 560-561 
funções associadas de Legendre, 583-595 
campo de indução magnética de um circuito de corrente, 
588-592 
construção de Gram-Schmidt, 597 
equação, 421, 583, 588-592, 596 
forma auto-adjunta, 583 
fórmula de Rodrigues, 584 
integral de Schlaefli, 580 
ortogonalidade, 587-588 
paridade, 587 
polinômios associados de Legendre, 584-585 
polinômios de Legendre associados mais baixos, 585 
pólos, 574, 592 
relações de recorrência, 586 
representação hipergeométrica, 652 
segunda espécie, 610-614 
transformada de Fourier, 582 
valores especiais, 586 
harmônicos esféricos vetoriais, 615-617 
harmônicos esféricos, 595-600 
dependência azimutal — ortogonalidade, 595 
dependência de ângulo polar, 596 
exercícios, 598-600 
harmônicos esféricos, 596-598 
série de Laplace, teorema da expansão, 598 
série de Laplace — campos de gravidade, 598 
integrais de produto de três harmônicos esféricos, 607-609 
aplicações de relações de recorrência, 608 
exercícios, 609 
operadores de momento angular orbital, 600-603 
ortogonalidade, 571-572 
anel de carga elétrica, 575-576 
campo gravitacional da Terra, 573 
esfera em campo elétrico uniforme, 574-575 
exercícios, 576-579 
expansão de funções, série de Legendre, 572-573 
polarização de dielétrico, 578 
potencial eletrostático de um anel de carga, 575-576 
relações de recorrência e propriedades especiais, 566-571 
da segunda espécie, 610-615 
equações diferenciais, 567-568 
esfera em campo elétrico uniforme, 574-575 
exercícios, 570-571 


exercícios, 614-615 
funções Qn (x) da segunda espécie, 611-612 
limites superiores e inferiores para Pp (cos 0), 569-570 
paridade, 569 
relações de recorrência, 566-567 
solução de série da equação de Legendre, 610-611 
soluções de forma fechada, 612-614 
valores especiais, 568 

teorema da adição para harmônicos esféricos, 602-607 
derivação do teorema da adição, 603-605 
exercícios, 605-607 
identidade trigonométrica, 603 

teorema da adição, 603 


funções de Mathieu, 658-665, 697 


expansões de Fourier de, 695-703 
coeficientes principais de sei, 698-701 
coeficientes principais para ceo, 701-703 
equações integrais e série de Fourier para funções de Mathieu, 
695-698 
funções radiais de Mathieu, 661-665 
pêndulo quântico, 661 
propriedades gerais de funções de Mathieu, 661 
separação de variáveis em coordenadas elípitcas, 658-659 
tambor elíptico, 659-660 


funções de múltiplos valores, 309 
funções de Neumann, 386 


definição de função de Hankel, 534-535 
esférica, 383, 549 
forma assintótica, 455 
forma integral, 530 
fórmulas wronskianas, 531 
funções de Bessel da segunda espécie, 529-534 
definição e forma de série, 529 
fórmulas wronskianas, 531 
guias de onda coaxiais, 532 
outras formas, 530 
relações de recorrência, 531 
relações de recorrência, 531 
transformada de Fourier, 455 


funções de Neumann, forma integral, 530 
funções de onda de espinor, 161 
funções de onda, 471 


espinor, 161 


funções de transferência, 728-731 


significância de D(t), 729-730 


funções de Whittaker, 656, 696 
funções descontínuas, 672 
funções digama e poligama, 386-390 


expansão de Maclaurin, cálculo, 387 
função poligama, 386-387 

funções digama, 386 

somatório de série, 387 


funções esféricas de Bessel, 548-559 


definições, 548-551 

relações de recorrência, 552 
valores assintóticos, 551 
valores limitadores, 551-552 


funções hipergeométricas confluentes, 653-658 


casos diversos, 655 

expansões assintóticas, 655 

funções de Bessel e funções modificadas de Bessel, 655 
funções de Hermite, 655 

funções de Laguerre, 633-634 
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funções de Whittaker, 656 
representações integrais, 655 
wronskiano, 657 
funções hipergeométricas, 650-653 
relações de funções contíguas, 651 
representações hipergeométricas, 652 
funções holomórficas (funções analíticas ou regulares), 314 
funções meromórficas, 332, 349-350 
expansão de pólo de, 349-350 
integral de, 353 
funções modificadas de Bessel, 539-544 
expansão assintótica, 537, 544 
forma de série, 540 
função geradora, 536 
relações de recorrência, 540-541 
representação integral, 544-546 
transformada de Fourier, 541 
transformada de Laplace, 706 
funções multivalentes, 338-340 
funções ortogonais, representação da função delta de Dirac por, 69 
funções ortonormais, 484-486 
polinômios, 488 
vetores, 132 
funções periódicas, 672-674 
condições de fronteira, 480, 669-670 
funções poligama, 386-387 
constante de Catalan, 387 
funções radiais de Mathieu, 661-665 
funções regulares (funções holomórficas ou funções analíticas,314 


G 
ganchos, 209 
geodésica, 120-123 
geradores de grupos contínuos, 187-198, veja também rotações; 
SU(2) 
exercícios, 197-198 
visão geral, 187-190 
gradiente, coordenadas curvilíneas, 85 
gradiente, V, 26-30 
como operador vetorial diferencial, 85 
de potencial, 27 
de produto escalar, 36 
definições integrais de divergência, espiral, e, 44-45 
exercícios, 30 
interpretação geométrica, 28-30 
de potencial, força como, 29 
integração por partes de, 29 
visão geral, 26-27 
gradiente 
em coordenadas cartesianas, 29, 39, 88, 104 
em coordenadas cilíndricas circulares, 91 
em coordenadas curvilíneas, 85 
em coordenadas polares esféricas, 98 
grande círculo, 789 
Grupo abeliano, 184 
grupo de Lorentz, veja grupo homogêneo de Lorentz 
grupo fiel, 184 
grupo homogêneo de Lorentz, 211-215 
cinemática e dinâmica em espaço-tempo de Minkowski, 213-215 
exercícios, 215 
visão geral, 211-213 
grupo homomórfico, 184 
grupo isomórfico, 184 
grupo ortogonal SO(3), 192-193, 194 


grupo unitário especial SU(2), 191 
grupos diédricos, Dn, 227 
grupos discretos, 221-231 
classes e caráter, 222-223 
eixo de simetria duplo, 223-225 
eixo de simetria triplo, 225-227 
exercícios, 228-231 
grupos diédricos, Dn, 227 
ponto cristalográfico e grupos espaciais, 227 
subgrupos e grupos laterais, 223 
grupos e álgebras de Lie, 184, 188, 200-202 
grupos e classes laterais, 223 
grupos laterais e subgrupos, 223 
grupos ortogonais, 184 
grupos unitários especiais 
SU(2), matrizes de spin de Pauli, 143, 154-155, 189-202, 203-205, 
208-210 
SU(n), tableaux de Young, 208-209 
SU(3), matrizes de Gell-Mann, 194-107, 201-202, 208-210 
grupos unitários, 184 
guias de onda coaxiais, 532 
guias de onda, coaxial, funções de Bessel, 532 


H 
harmônicos esféricos, 200, 595-600 
convenções de fase de Condon-Shortley, 205 
integrais de, 608 
operadores escalonados, 602-603 
dependência azimutal — ortogonalidade, 595 
dependência de ângulo polar, 596 
harmônicos esféricos vetoriais, 615-617 
harmônicos esféricos, 596-598 
integral de ortogonalidade, 596 
operadores de momento angular, 600 
relações de ortogonalidade, 615 
série de Laplace, teorema da expansão, 598 
teorema da adição para, 603-607 
derivação do teorema da adição, 603-605 
identidade trigonométrica, 603 
harmônicos vetoriais esféricos, 615-617 
harmônicos, veja também harmônicos esféricos, harmônicos vetoriais 
esféricos 
Hausdorff, 171, 188, 823 
hipercarga, 195 
hipótese estatística, 864 
homomorfismo, 184-185 
SU(2) e SO(3), 191-194 
rotações, 185 
visão geral, 184 
horizonte de evento, 790 


identidade de Euler, 170 
fórmula de produto, 290-292 
identidade de Jacobi, 188 
identidade trigonométrica, 603 
igualdade de matrizes, 135 
inclinação mais acentuada, método da, 370-375 
função fatorial, 374 
funções de Hankel, 373-374 
funções modificadas de Bessel, 544 
inclinação, mais acentuada, veja pontos de sela (método da 
inclinação mais acentuada) 
independência linear de soluções, 439-440 
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independência, linear, 132, 437-439, 485, 502, 531 
de soluções de equações diferenciais ordinárias, 437-439 
de vetores, 132, 437 

infinitidade, veja pólo, singularidade, essencial 

integração, 684, veja também trabalho dependente de trajetória 
de série de potências, 276 
de transformadas, 746 
de vetores, 42-46 

exercícios, 46 
visão geral, 42-43 
desenvolvimento da integral de Fourier, 708-710 
derivação da função delta de Dirac, 709-710 
integral de Fourier — forma exponencial, 709 
fórmula de Euler-Maclaurin, 288-290 
função geradora, 768-772 
equação generalizada de Abel, teorema da convolução, 769 
função geratrizes, 770 
solução de transformada de Fourier, 769 
funções de transferência, 728-730 
exercícios, 731 
significância de D(t), 729-730 
linearidade, 706-707 
outras propriedades, 742-750 
analogia com RLC, 742-743 
derivada de uma transformada, 744-745 
equação de Bessel, 745-746 
exercícios, 746-750 
integração de transformadas, 746 
limites de integração — função escalonada unitária, 746 
ondas eletromagnéticas, 744 
oscilador atenuado, 742 
substituição, 741-742 
translação, 743 
pólo simples sobre contorno de, 354-355 
por partes de divergência, 31 
por partes de espiral, 36 
por partes de gradiente, 29 
representação de momento, 723-728 
átomo de hidrogênio, 725 
exercícios, 726-728 
oscilador harmônico, 726 
teorema da convolução (obraduras), 750-753 
exercícios, 753 
oscilador forçado com atenuação, 751-753 
teorema da convolução, 720-723 
exercícios, 722-723 
relação de Parseval, 721 
transformada de Fourier da gaussiana, 705-706 
transformada de Fourier de derivadas, 716-720 
EDP de fluxo de calor, 718 
equação de onda, 717 
inversão de EDP, 718-719 
transformada de Fourier, 705 
transformada de Laplace de derivadas, 736-741 
exercícios, 740-741 
força impulsiva, 739 
função delta de Dirac, 738-739 
nutação da Terra, 737-738 
oscilador harmônico simples, 737 
transformada inversa de Laplace, 753-761 
exercícios, 759-761 
integral de Bromwich, 753-754 
inversão via cálculo de resíduos, 755 


resumo — inversão de transformada de Laplace, 758 


velocidade de ondas eletromagnéticas em um meio dispersivo, 


756-757 
transformadas de Fourier de derivadas, 719-720 
transformadas de Fourier — teorema da inversão, 710-716 
exercícios, 713-716 
princípio da incerteza, 712 
transformada de co-seno, 710 
transformada de seno, 711 
transformada exponencial, 710 
trem de ondas finito, 711-712 
transformadas de Laplace, 731-736 
definição, 731 
exercícios, 735-736 
expansão por frações parciais, 733-734 
função escalonada, 734-735 
funções elementares, 731-732 
transformada inversa, 732-733 
transformadas de Laplace, Mellin e Hankel, 706 
transformadas integrais, 705-708 
exercícios, 707-708 
linearidade, 706-707 
transformada de Fourier da gaussiana, 705-706 
transformada de Fourier, 705 
transformadas de Laplace, Mellin e Hankel, 706 
integrais de erro, 400 
expansão assintótica, 298 
representação hipergeométrica confluente, 654 
integrais de Euler, 379 
integrais de linha, 42-43 
integrais de Lommel, 527 
integrais de superfície, 44 
integrais de volume, 44-45 
integrais definidas 
SS f(x) dz, 352-353 
SS Ha) dx, 353-357 
dispersão da mecânica quântica, 355-357 
pólo simples em integração de contorno, 354-355 
I f (sen 0, cos 0) do, 352 
avaliação de, 351 
formas exponenciais, 357-365 
função fatorial, 357-358 
números de Bernoulli, 358-359 
integrais elípticas, 281-285 
da primeira espécie, 282 
da segunda espécie, 282 
definições de, 282 
exercícios, 283-285 
expansão de série, 282-283 
período de pêndulo simples, 281 
representações hipergeométricas, 283, 651 
valores limitativos, 283 
visão geral, 281 
integrais vetoriais 
integrais de linha, 42 
integrais de superfície, 44 
integrais de volume, 44 
integrais, veja também teste da integral de Cauchy (Maclaurin) ; 
integrais definidas; integrais elípticas 
avaliação de, 612 
diferenciação de, 445 
em produtos de três harmônicos esféricos, 607-610 
integração de contorno, 351, 357, 380, 394, 455 
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Lebesgue, 490, 496 

linha, 43, 50-51, 333 

Riemann, 43, 46-47, 457, 480 

Stieltjes, 67, 660 

superfície, 44 

volume, 44 
integral de Bromwich, 753-754 
integral de erro de Gauss, 378 

expansão assintótica, 400 
integral de Fourier-Mellin, 754 
integral de ortogonalidade 

harmônicos esféricos, 596 

polinômios de Hermite, 621 

polinômios de Legendre, 588 
integral de Riemann, 46-47 
integral de Schlaefli, 536, 580-581 

polinômios de Legendre, 580-581 
integral definida (Euler), 377-378 
integral exponencial, 398-400 
integral — equação diferencial, 502-503 
integráveis ao quadrado, 367, 368 493, 497, 667 
interitem, 843 
interpretação física da divergência, 32-33 
interpretação geométrica de gradiente, 27-29 

de potencial, força como, 29 

integração por partes de, 29 
interpretação, veja interpretação geométrica de gradiente; 

interpretação física de divergência 

intervalo de confiança, 872, 874 
intervalo de integração [a, b], 474-475 
invariância de produto escalar sob rotações invariantes, 12-13 
invariantes eletromagnéticas, 219 
inversão, 337-338 

de EDP, 718-719 

de série de potências, 277 

matriz, 140-142 

Gauss-Jordan, 140-142 
visão geral, 140 

via cálculo de resíduos, 755 
irrotacional, 36 
isomorfismo, 184-185 

rotações, 185 

visão geral, 184 
isospin I, 194-195 
isospin, SU(2), 194-197 
aliasing, 693-694 


J 
jacobiano, 83 
transformação de paridade, 112 
jacobianos para coordenadas e polares, 84-85 


L 
lagrangiana, 799-800 
laplaciano 
com operador derivada tensorial, 123-124 
coordenadas polares esféricas, 98 
de potenciais, 39 
desenvolvimento por menores, 127-128 
em coordenadas cartesianas, 40, 418-419 
em coordenadas cilíndricas circulares, 92 
em coordenadas ortogonais, 240-241 
lei da área para movimento planetário, 90-92 
lei da transformação linear, 117 


lei da transformação vetorial, 17 

lei da transformação, 104 

lei de adição do paralelogramo, 2 

lei de Biot e Savart, 590-592 

lei de Faraday, 51-53 

lei de Gauss, 41, 61-65, 448 

lei de Hubble, 6 

lei dos co-senos, 13, 91, 563 

leis de Kepler do movimento planetário, 90-91 

lema de Jordan, 354 

lema de Schur, 201 

limite infinito (Euler), 377 

limites de integração — função escalonada unitária, 746 
limites para valores de integrais elípticas, 283-284 
limites superiores e inferiores para Pp (cos 6), 569-570 
linearidade, 706-707 

linha de corte (corte de ramo), 309 

linha reta, 792-793 


M 


magnético, 15, 36, 39-40, 51, 53, 58-59, 75, 78, 99, 111-112, 215, 
219, 233, 236-237, 241, 339, 405, 481-482, 518, 532-533, 


564, 588-592, 738 
mapa logístico, 819-821 
mapeamento 
conformal, 342-344 
exercícios, 343 
variáveis complexas, 335-342 
exercícios, 340-341 
inversão, 337-338 
pontos de ramo e funções multivalentes, 338-340 
rotação, 336 
translação, 336 
visão geral, 335 
R3, coordenadas ortogonais em, veja coordenadas ortogonais 
SO(3) 
coeficientes de Clebsch-Gordan, 202-205 
grupos de rotação, 189 
homomorfismo, 191-194 
SU(2) 
coeficientes de Clebsch-Gordan, 202-205 
e homomorfismo SO(3), 191-194 
isospin e simetria de sabor SU(3), 194-197 
SU(3) simetria de sabor, 194-197 
SU(n), tableaux de Young para, 208-211 
matriz de Hilbert, determinante, 178 
matriz de inércia, momento de, 163 
matriz de momento de inércia, 163 
matriz inversa, 152 
matriz nula, 135 
matriz transposta, Â, 152-153 
matrizes anti-hermitianas, 168-169 
autovalores 
degenerados, 169 
e autovetores de matrizes simétricas reais, 168 
visão geral, 168 
matrizes antissimétricas, 155 
matrizes auto-adjuntas, 158 
matrizes de Dirac, 159-161 
matrizes de Pauli, 159-161 
matrizes diagonais, 138-139, 163-175, veja também matrizes 
anti-hermitianas 
autovetores e autovalores, 164-166 
exercícios, 171-175 
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funções de, 169-171 
hermitiana, 166-167 
momento de inércia, 163 
matrizes hermitianas, 140, 158 
e diagonalização de matriz, 166-167 
unitárias e, 158-163 
exercícios, 161-163 
Pauli e Dirac, 159-161 
visão geral, 158 
matrizes hermitianas, anti-, 168-169 
autovalores 
degenerados, 169 


e autovetores ode matrizes simétricas reais, 168 


visão geral, 168 
matrizes malcondicionadas, 178 
matrizes normais, 175-181 
exercícios, 179-181 
mal condicionada, 178 


modos normais de vibração, 176-177 


visão geral, 175-176 
matrizes ortogonais, 148-158 

ângulos de Euler, 153-154 

aplicações a vetores, 150 


condições multidimensionais para, 151-152 


co-senos direcionais, 148-149 
exercícios, 156-158 
inversa, 152 
matriz transposta, À, 152-153 
propriedades de simetria, 154-156 
relação com tensores, 156 
visão geral, 148-149 

matrizes simétricas, 154 


matrizes unitárias, veja também matrizes hermitianas 


álgebra, 159-161 
anel, 137, 142 


elemento unitário de grupo, 222-223 


espaço vetorial, 158 
função degrau unitária, 145 
Heaviside, 73, 743, 746, 755 


matrizes, 126-182, veja também determinantes; matrizes diagonais 


matrizes ortogonais 
adição e subtração, 135-136 
adjuntas, 158 
ângulo de rotação de Euler, 153 
anti-hermitiano, 168-169, 175 
anti-simétrico, 155 
auto-adjunta, 158 
conjuntos anticomutativos, 179 
definição, 134 
diagonalização, 163-164 
exercícios, 142-148 
hermitiano e unitário, 158-163 
exercícios, 161-163 
Pauli e Dirac, 158-161 
visão geral, 158 
igualdade, 135 
inversão de, 140-142 
Gauss-Jordan, 140-142 
visão geral, 140 
lei da transformação vetorial, 150 
matriz nula, 135 
matriz ortogonal, 152-153, 156, 158 


matrizes de momento angular, 192, 207 


modos normais de vibração, 176-177 
momento de inércia, 163-164, 167 
multiplicação de matrizes, 134, 136-137 
multiplicação, 136-137 
por escalar, 136 
produto direto, 138 
produto interno, 136-137 
normal, 175-182 
exercícios, 179-182 
operador levantamento, 199 
ordem, 135 
produto direto, 138 
quatérnion, 155, 160 
relação a tensor, 156 
representação, 134, 140, 156, 158, 160-161 
simétrico, 154 
sistemas mal condicionados, 178 
técnica da inversão de matriz de Gauss-Jordan, 140 
teorema do produto, 137 
traços, 108, 139-140 
transformação de similaridade, 156 
transposição, 134 
unitária, 158 
visão geral, 134-135, 175-176 
sen x 
representação de produto infinito, 187, 297-298, 302, 332, 


354-355, 440, 513-514, 550-551, 552, 670, 673, 675, 689, 


719, 775, 832-833 
séries de potências, 271, 307, 310 
mecânica quântica, regras da soma, 366 
átomo de hidrogênio, 186 
momento angular, 143-146, 190-194, 198-200, 202-205 
representação de espaço de configuração, 725 
representação de momentum, 764 
representação de Schrödinger, 764 
valores esperados, 199 
membrana circular, funções de Bessel, 524, 535 
menor, 128 
menores, desenvolvimento laplaciano por, 127-128 
método de Frobenius, solução de série, 427-437 
método de Gauss-Seidel, 171 
métodos não-lineares e caos, 818-841 
equações diferenciais não-lineares (EDNs), 825 
bifurcações em sistemas dinâmicos, 837-838 
caos em sistemas dinâmicos, 838-839 
centro ou ciclo, 834-835 


comportamento local e global em número maior de dimensões, 


829 
dissipação em sistemas dinâmicos, 836-837 
equações de Bernoulli e Riccati, 826 
equações diferenciais autônomas, 827-829 
exercícios, 826, 836, 840 
ponto de sela, 830-832 
ponto fixo espiral, 833-835 
rotas para o caos em sistemas dinâmicos, 840 


singularidades fixas e móveis, soluções especiais, 826-827 


sorvedouro estável, 830 
introdução, 818-819 
mapa logístico, 819-822 
exercícios, 822 
sensibilidade a condições iniciais e parâmetros, 822-825 
exercícios, 825 
expoentes de Lyapunov, 822-823 
fractais, 823-824 
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métricas, coordenadas curvilíneas, 81-82 
mínimos quadrados, método dos, 849 
modelo da gotas de líquido, 594 
modo de oito vezes (diagrama de peso), 195 
modos de vibração, normal, 176-177 
módulo, 307 
momento angular orbital, 190, 198-202 
abordagem de operador levantamento, 198-200 
exercícios, 202 
grupos e álgebras de Lie, 200-202 
grupos e operadores de Lie, ordem de, 200-201 
operadores, 600-603 
rotação de, 190 
visão geral, 198 


momento angular, 14-15, 163, 203, veja também acoplamento de 


momento 
angular orbital, 202-211 


coeficientes de Clebsch-Gordan SU(2) e SO(3), 203-205 


exercícios, 210-211 
visão geral, 202 
tensores esféricos, 206-208 
momento, veja momento angular; momento angular orbital 
momentos magnéticos, 112 
monopolo, 563-564 
movimento de partícula 
coordenadas cartesianas, 800 
coordenadas cilíndricas circulares, 800-801 
dentro de um cilindro circular reto, 806 
dentro de uma caixa retangular, 805-806 
dentro de uma esfera, 553 
mecânica quântica, 626 
movimento planetário, lei da área para, 90-92 
movimento 
equações de, 110 
lei da área para, planetário, 90-92 
mudanças de sinal, séries com, irregulares, 259-260 
mudanças irregulares de sinais, séries com, 259-260 
multipleto, 186 
multiplicação 
de matrizes 
por escalar, 136 
produto direto, 138 
de vetores, 138 
produto interno, 136-137 
multiplicadores lagrangianos, 804-808 
partícula dentro de uma caixa, 805-806 
reator nuclear cilíndrico, 806 
multipolos elétricos lineares, 562-563 
mutuamente exclusivo, 842-843 


nó, espiral, 832, 837-838 

normalização, 525 

notação bra-ket de Dirac, 134 

notação de Gauss, 380 

notação fatorial, 380-381 

núcleo separável, 775 

número de condição, de sistemas mal condicionados, 178 
número de Feigenbaum, 821 

números primos, 287, 290-291, 679 

números, de Bernoulli, veja Números de Bernoulli 
nutação, 737-738 

nutação da Terra, 737-738 


Oersted, lei de, 41, 51-53 
Olbers, paradoxo de, 256 
onda em dente de serra, 670 
onda quadrada - altas freqiiências, 675-676 
onda quadrada, 689-690 
ondas eletromagnéticas, 744 
ondas esféricas, funções de Bessel, 552 
ondas progressivas cilíndricas, 535 
operador * de Hodge, 239-243 
equações de Maxwell, 241-244 
laplaciano em coordenadas ortogonais, 241 
produto cruzado de vetores, 240 
visão geral, 239-240 
operador auto-adjunto, 470, 475 


teoria de Sturm-Liouville, equações diferenciais, 469-475 


operador de aniquilação, 623 

operador de criação, 623 

operador de elevação, 199 

operador de número, 622 

operador de redução, 199 

operador de tensor esférico, 205 

operador inverso, 707, 733 

operador linear, 68, 134, 158, 404, 469, 490 


operador diferencial, 33-34, 189, 198, 216, 231, 234, 418, 430, 


475, 478, 501 
operador integral, 580, 773 
operador modificado de Helmholtz, 451 
operador(es) de momento angular, 198 
coeficientes de Clebsch-Gordan, 607 
harmônicos esféricos, 600 
harmônicos esféricos vetoriais, 615-617 
orbital, 600-602 
operadores de Casimir, 201 
operadores de Helmholtz, 451 
operadores de projeção, 486 
operadores derivados, tensor 
divergência, 123-124 
rotacional, 124-125 
exercícios, 125 
laplaciano, 124 
visão geral, 123 


operadores escalonados, abordagem do momento angular orbital, 


199-200 
operadores hermitianos, 475, 479-484 
autofunções ortogonais, 480 
autovalores reais, 479 
compleude de autofunções, 490-497 
degeneração, 481 
em Mecânica Quântica, 475 


expansão em autofunções ortogonais - onda quadrada, 481 


intervalo de integração, 474 
propriedades de, 479-481 
série de Fourier, ortogonalidade, 480 
operadores tensoriais derivada 
divergência, 123-124 
rotacional, 124-125 
exercícios, 125 
laplaciano, 124 
visão geral, 123 
operadores vetoriais diferenciais, 85-88 
adjunta, 469, 470, 479 
divergência, 86-87 
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rotacional, 87-88 
exercícios, 88 
gradiente, 85 
nabla, 26 
visão geral, 85 
operadores, vetorial diferencial, veja diferenciais operadores 
vetoriais 
ordem, 200 
de matrizes, 135 
de tensor, 103 
ordem fracionária, 323 
ortogonalidade, 525-529, 552-553, 587-588, 621, 647 
campo gravitacional da Terra, 573 
coordenadas curvilíneas, 80-81 
de vetores, 11 
equações diferenciais, Sturm-Liouville, 782 
esfera em campo elétrico uniforme, 574-575 
expansão de funções, série de Legendre, 572-573 
forma de contínuo, 526 
normalização, 525 
potencial eletrostático de um anel de carga, 575-576 
potencial eletrostático em um cilindro oco, 526 
série de Fourier, 480-481 
série de Fourier: equações integrais de Hilbert-Schmidt, 695-703 
séries de Bessel, 525 
sobre pontos discretos, 692 
ortogonalização de Gram-Schmidt, 484-490 
ortogonalização de Schmidt, veja Gram-Schmidt 
ortogonalização, Gram-Schmidt, 132, 484-488 
oscilação harmônica simples atenuada, 742 
oscilador atenuado, 742 
oscilador clássico forçado, 346-349 
oscilador forçado com atenuação, 751-752 
oscilador harmônico simples da mecânica quântica, 622-625 
oscilador harmônico simples, 737 
oscilador harmônico, 407, 622-625, 726 
oscilador linear 
função de Green, 505 
oscilador 
atenuação, 742, 751-752 
equação auto-adjunta, 513 
equação integral para, 751-752 
forçado clássico, 346-349 
forçado, 346, 427, 751-752 
função de onda no espaço de momentum, 430 
harmônico, 622-625 
linear, 505 
singularidades na equação diferencial de oscilador harmônico, 426 
solução de série de equação diferencial, 429 
solução de transformada de Laplace, 751-752 


P 


panorama analítico, 370-371 
parâmetro de ordem, 823 
parâmetros de Cayley-Klein, 191 
paridade, 569, 587, 711 
funções de Bessel, 520, 556 
funções de Chebyshev, 430 
funções de Hermite, 430 
funções de Legendre, 430 
funções de Legendre, associadas, 587 
funções de Legendre, segunda espécie, 614 
harmônicos esféricos vetoriais, 615 
harmônicos esféricos, 587, 598 


operador diferencial, 430 
transformadas de Fourier de co-seno, seno, 711 
parte imaginária, 308 
parte real, 308 
partícula em movimento 
coordenadas cartesianas, 800 
coordenadas cilíndricas circulares, 800-801 
partícula 
dentro de uma caixa, 805-806 
dentro de uma esfera, 553 
patamar de produção de píons, 214-215 
película de sabão, 793-794 
película de sabão — área mínima, 794-796 
pêndulo quântico, 661 
pêndulo simples, 809-810 
pêndulos, período de, simples, 281 
pequenas oscilações, 281 
permutações e combinações, contagem de, 845-846 
pi, 7, 166, 287, 300-303, 442 
fórmula de Leibniz, 445, 587, 671 
fórmula de Wallis, 302 
polinomiais de Chebyshev, 642-650 
construção de Gram-Schmidt, 488 
deslocada, 488, 643 
forma trigonométrica, 646 
função geradoras, 642 
ortogonalidade, 647 
relação de recorrência, 643 
relações de recorrência — derivadas, 645 
representações hipergeométricas, 652 
tipo I, 642-645 
tipo II, 642 
polinômios associados de Legendre mais baixos, 585 
polinômios de Gegenbauer, veja polinômios ultra-esféricos 
polinômios de Hermite 
polinômios de Laguerre, 471 
associados, 471-472 
função geradora, 636-637 
ortogonalidade, 637-638 
relações de recorrência, 637 
representação de Rodrigues, 580, 637 
representação hipergeométrica confluente, 655 
representação integral, 637 
construção de Gram-Schmidt, 488 
equação de onda de Schrödinger, 638 
equação diferencial, 633-636 
forma auto-adjunta, 471, 635 
fórmula de Rodrigues, 635 
função geradora, 633-635 
ortogonalidade, 471, 488 
relações de recorrência, 635, 637 
representação hipergeométrica confluente, 655 
singularidades, 426 
polinômios de Legendre, 487-488, 560-562 
associados 
função geradora, 584 
relações de recorrência, 586 
equacão de Laplace, 574, 575 
fórmula de Rodrigues, 575 
função geradora, 561 
integral de ortogonalidade, 588 
integral de Schlaefli, 580 
por ortogonalização de Gram-Schmidt, 487 
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relações de recorrência, 566-567 
polinômios interpoladores, 147 
polinômios ultra-esféricos, extensão para, 564 
equação, 645, 652 
forma auto-adjunta, 646 
polinômios, Bernoulli, 288 
pólo simples sobre contorno de integração, 354-355 
pólos, 332 
simples, sobre contorno de integração, 354-355 
ponto cristalográfico e grupos espaciais, 227-228 
ponto crítico, 827-829 
ponto fixo espiral, 833-835 
ponto(s) singular(es), 425-426 
essencial (irregular), 425 
irregular (essencial), 425 
não-essencial (regular), 425 
regular (não-essencial), 425 
pontos de ramo, 333-334 
de ordem 2, 333-334 
e funções multivalentes, 338-340 
pontos de sela (método do declínio mais acentuado), 370-376, 828, 
830-832, 837 
exercícios, 375-376 
formas assintóticas 
da função de Hankel HP (s), 373-374 
de função fatorial T, 374 
função de Hankel HP + 373-374 
função fatorial T(z), 374 
panorama analítico, 370-371 
visão geral, 370 
pontos e grupos espaciais, cristalográficos, 227-228 
potenciais, 53-61, veja também termodinâmica 
escalar, 53-56 
centrífuga, 56 
gravitacional, 56 
visão geral, 53-54 
gradiente de, 27 
força como, 29 
laplaciano de, 39 
vetor, 57-61 
de campo B constante, 34 
exercícios, 59-61 
magnético, 58-59 
visão geral, 53 
potencial dipolar elétrico, expansão de polinômio de Legendre, 563 
potencial eletrostático, 448 
de um anel de carga, 575-576 
em cilindro oco, 526 
potencial escalar, 26-27, 54, 404 
potencial vetorial, 57, 237 
precessão de Thomas, 212 
primitiva, 680 
princípio da incerteza de Heisenberg, 553, 712 
princípio da incerteza na teoria quântica, 712 
princípio da reflexão de Schwarz, 326-327 
princípio de Fermat, 120, 790, 797 
princípio de Hamilton, 799-800 
princípio de reciprocidade, 502 
princípio de superposição para EDOs, EDPs homogêneas, 404-405 
probabilidade, 842-875 
definições, propriedades simples, 842-875 
contagem de permutações e combinações, 845-846 
exercícios, 846-847 


probabilidade condicional, 844 
probabilidade para A ou B, 843 
testes de aptidão escolar, 844-845 
distribuição binomial, 857-859 
exercícios, 859 
repetidos lançamentos de dados, 857-858 
distribuição de Poisson, 859-561 
exercícios, 861 
distribuição normal de Gauss, 861-864 
exercícios, 864 
estatística, 864 
ajustar curvas a dados, 866-869 
distribuição x?, 869-871 
distribuição t de Student, 872-874 
exercícios, 874-875 
intervalo de confiança, 874 
propagação de erro, 865-866 
variáveis aleatórias, 847-857 
exercícios, 856-857 
medições de desvio padrão, 850-852 
retiradas repetidas de cartas, 853-855 
soma, produto e razão de variáveis aleatórias, 855-856 
variável aleatória contínua: átomo de hidrogênio, 848-849 
variável aleatória discreta, 847-848 
probabilidade condicional, 844 
probabilidade paraA ou B, 843 
problema de Dirichlet, 467 
problema de Neumann, 467 
procedimento de Gram-Schmidt, 132 
vetores por ortogonalização, 132 
visão geral, 132 
produto cruzado, 14-17, veja produtos vetoriais triplos 
de vetores, 240 
exercícios, 17-20 
visão geral, 14-17 
produto de Euler para função zeta de Riemann, 290-292 
produto de Hadamard, 157 
produto de Kronecker, 138 
produto de tensor direto, 107-108 
produto direto, 107-109 
de tensores, 108 
e multiplicação de matrizes, 138 
exercícios, 108-109 
visão geral, 108 
produto infinito (Weierstrass), 377, 379-380 
produto interno e multiplicação de matrizes, 136-137 
produto vetorial, 4, 9, 14-17, 20-23, 34, 36, 113, 206 
produtos escalares triplos, 20-21, 126 
produtos escalares, 10-13 
exercícios, 13 
gradiente de, 36 
invariância de produto escalar sob rotações, 11-13 
visão geral, 10-12 
produtos infinitos, 287, 291, 300-302, 377, 379-380 
convergência, 301 
co-seno, 301-302 
função gama, 301-302 
funções inteiras, 350 
seno, 301-302 
produtos vetoriais triplos, 22-23, 36 
exercícios, 22-25 
regra BAC-CAB, 22, 36, 39 
visão geral, 21 
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produtos, veja também roduto cruzado, produto direto, produtos 
escalares 


de séries infinitas, 300-304 
convergência de, infinita, 301 
exercícios, 303-304 
funções seno, co-seno e gama, 301-302 
visão geral, 300-301 
expansão de funções inteiras, 350-351 
projeções, de vetores, 4, 9 
propriedade de operador adjunto, 158 
propriedades gerais, 667-672 
completude, 669 
comportamento de descontinuidades, 671 
de funções de Mathieu, 661 
onda em dente de serra, 670 
somatório de uma série de Fourier, 668 
teoria de Sturm-Liouville, 670 
variáveis complexas — teorema de Abel, 668 
prova de Goursat do teorema integral de Cauchy, 318-320 
pseudo-escalares, 112 
pseudotensores, 110-116 
exercícios, 115-116 
símbolo de Levi-Civita, 113 
tensores duais, 113-114 
tensores irredutíveis, 115-116 
visão geral, 110-113 
pseudovetores, 112 


Q 


quadrados de séries, divergentes, 261 
quadrupolo, 114-115, 563-564, 609 
quantidades escalares, 1 

quantidades vetoriais, 1 

quantização, 471-472, 800 
quase-periódico, 834-836, 840 
quatérnions, 143, 155, 160 


raio de Bohr, 638 
rapidez, 212 
rearranjo de série dupla, 262-264 
recíproca, 693 
regiões multiplamente conexos, 320 
regra da adição, 843 
regra da cadeia, 27 
regra de Cramer, 126 
regra de l’ Hôpital, 277 
regra do quociente, 109-110 
equações de movimento e equações de campo, 110 
exercícios, 110 
visão geral, 109-110 
regra do triângulo, 204 
regras da soma, 366 
regras de seleção, 201 
relação de anticomutação, 15 
relação de energia de Einstein, 213 
relação de Parseval, 367-368, 721 
relações de dispersão óptica de Kronig-Kramers, 366, 367 
relações de dispersão, 365-370 
causalidade, 368 
dispersão óptica, 367 
exercícios, 369 
regras da soma, 366 
relação de Parseval, 367-368 


relações de cruzamento, 366 
relações de simetria, 366 
transformada de Hilbert, 367 
visão geral, 365-366 
relações de funções contíguas, 651 
relações de ortogonalidade, harmônicos esféricos, 615 
relações de recorrência, 428, 540-541, 566-567, 586, 618-619 
aplicação de, 608-609 
derivadas, 645 
e propriedades especiais, 566-571 
equações diferenciais, 567-568 
limites superiores e inferiores para Pp (cos 0), 569-570 
paridade, 569 
relações de recorrência, 566 
valores especiais, 568 
função fatorial, gama, 380, 382, 400, 754 
funções de Bessel, 511 
Funções de Bessel, esféricas, 552 
funções de Hankel, 535 
funções de Laguerre, associadas, 637 
funções de Neumann, 531 
funções esféricas de Bessel, 552 
funções hipergeométricas confluentes, 655 
funções hipergeométricas, 652 
funções modificadas de Bessel, 566-567 
funções poligama, 387 
integral exponencial, 400 
números de Bernoulli, 286 
polinômios associados de Legendre, 586 
Polinômios de Chebyshev, 643 
polinômios de Hermite, 618-619 
polinômios de Legendre, 566-567 
séries de Legendre, 610-611 
relações, veja relações de dispersão 
repelente, 820 
representação 
fundamental, 197, 208-209 
irredutível, 186, 199, 201, 204, 208, 209, 227 
redutível, 186 
representação de Fourier, da função delta de Dirac, 70 


representação de integral de contorno, funções de Hankel, integrais 


de contorno, 536-537 
representação de momentum em mecânica quântica, 764 
representação de momento, 723-728 

átomo de hidrogênio, 725 
equação de onda de Schrödinger, 725 
oscilador harmônico, 726 
representação de Rodrigues, 620-621 
polinômios de Hermite, 620-621 
representações integrais, 381, 513-514 
expansão de, 544-546 
para função delta de Dirac, 70 
representações irredutíveis, 185-186 
representações redutíveis, 185-186 
repulsivo espiral, 832, 837 
repulsor, 828 
reticulado recíproco, 21 
retificador de onda completa, 676-677 
equação funcional, função zeta de Riemann, 678 
função gama, 377 
retificador, de onda completa, 676-677 
retiradas repetidas de cartas, 853-855 
retornos, 235-238 
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teorema de Gauss, forma diferencial, 237-238 
teorema de Stokes, 236 
forma diferencial, 236-237 
visão geral, 235-236 
rotações, 134, 336 
de coordenadas, 151 
de eixos coordenados, 6-9 
exercícios, 9-10 
vetores e espaço vetorial, 9 
de funções e momento angular orbital, 190 
grupos SO(2) e SO(3), 189 
invariância de produto escalar sob, 12-13 
isomórfica e homomórfica, 184-185 
rotas para o caos em sistemas dinâmicos, 764 


S 
seção de Poincaré, 838-840 
seção, veja seção de Poincaré 
segunda lei de Newton, 101, 176, 281, 737, 800 
seno 
funções de produto infinitos, 301-302 
integrais em séries assintóticas, 297-298 
representação hipergeométrica confluente, 298 
sensibilidade a condições iniciais e parâmetros, 822-825 
expoentes de Lyapunov, 822-823 
fractais, 823-824 
separação de variáveis em coordenadas elípticas, 658-659 
série de Bessel, 525 
série de Dirichlet, 248 
série de Gregory, 274, 279 
série de Laplace 
campos gravitacionais, 598 
teorema da expansão, 598 
série de Legendre, 253-254, 610-611 
relações de recorrência, 610-611 
série de Neumann, 772-773 
série de Neumann, núcleos separáveis (degenerados), 772-781 
núcleo separável, 775 
solução numérica, 776-777 
série de Stirling, 390-393 
derivação da fórmula de integração de Euler-Maclaurin, 390 
série divergente, 248 
série dupla, rearranjo de, 262-264 
série harmônica, 246-247 
séries alternantes, 258-260 
convergência absoluta, 259-260 
critério de Leibniz, 258 
exercícios, 260 
visão geral, 258 
séries assintóticas, 295-300 
definição de, 298 
exercícios, 299-300 
função gama incompleta, 295-297 
funções de Bessel, 545 
funções hipergeométricas confluentes, 298 
inclinação mais acentuada, 370-375 
integrais de co-seno e seno, 297-298 
método de Stokes, 544, 547 
visão geral, 295 
visão geral: expansão de representação integral, 544-546 
séries de Bessel de Fourier, 525 
séries de Fourier, 667-704 
aplicações de, 675-683 
exercícios, 680-683 


onda quadrada — alta freqüência, 675-676 
retificador de onda completa, 676-677 
séries infinitas, função zeta de Riemann, 677-680 
expansões de Fourier de funções de Mathieu, 695-703 
coeficientes principais de se;, 698-701 
coeficientes principais para ceo, 701-703 
equações integrais, e séries de Fourier para funções de Mathieu, 
695-698 
exercícios, 703 
fenômeno de Gibbs, 688-691 
cálculo do aumento momentâneo (overshoot), 690-691 
exercícios, 691 
onda quadrada, 689-690 
somatório de séries, 689 
ortogonalidade, 480 
propriedades de, 684-688 
convergência, 684 
diferenciação, 684-685 
exercícios, 685-688 
integração, 684 
propriedades gerais, 667-672 
completude, 669 
comportamento de descontinuidades, 671 
exercícios, 671-672 
onda em dente de serra, 670 
onda quadrada, 675 
somatório de uma série de Fourier, 668 
teoria de Sturm-Liouville, 670 
variáveis complexas — teorema de Abel, 668 
somatório de, 668 
transformada discreta de Fourier, 692-695 
exercícios, 694-695 
limitações, 693 
ortogonalidade sobre pontos discretos, 692 
transformada discreta de Fourier, 692-693 
transformada discreta de Fourier — aliasing, 693-694 
transformada rápida de Fourier, 694 
vantagens, usos de, 672-675 
completude, veja propriedades gerais da série de Fourier 
convergência, 676, 684-688 
diferenciação, veja propriedades gerais da série de Fourier 
funções descontínuas 
exercícios, 674-675 
funções descontínuas, 672 
funções periódicas, 672 
integração, veja propriedades gerais da série de Fourier 
mudança de intervalo, 674 


séries de potências, 275-280 


continuidade, 276 
convergência, 275 
uniforme e absoluta, 275 
diferenciação e integração, 276 
exercícios, 278-280 
inversão de, 277 
teorema da unicidade, 276-277 
regra de L’ Hôpital, 277 
visão geral, 276 


séries geométricas, 246 
séries infinitas, 245-304, veja também séries alternantes; séries de 


potências; expansão de Taylor 
álgebra de, 260-264 
convergência de Raabe, 253 
convergência uniforme, 264-267, 276 
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convergência, 260-262 
convergência: absoluta, 260-261 
convergência: comparação, 248 
convergência: condicional, critério de Leibniz, 261 
convergência: de Gauss, 253 
convergência: de Kummer, 251-252 
convergência: integral de Cauchy, 249-251 
convergência: integral de Maclaurin, 249-251 
convergência: melhoria da, 262 
convergência: raiz de Cauchy, 248 
convergência: razão de D’ Alembert, 249 
convergência: testes de, 248-254 
divergência de quadrados, 261-262 
exercícios, 264 
rearranjamento de dupla, 262-264 
séries alternantes, 260-261 
séries duplas, 262-263 
visão geral, 260-261 
conceitos fundamentais, 245-247 
adição e subtração de, 247 
exercícios, 247-248 
geométrico, 246 
harmônico, 246-247 
visão geral, 245 
de funções, 264-267 
convergência uniforme e não-uniforme, 265 
exercícios, 267 
teste M de Weierstrass, 265 
teste de Abel, 266 
visão geral, 264 
integrais elípticas, 281-285 
definições de, 282 
exercícios, 284-285 
expansão de série, 282-283 
período de pêndulo simples, 281 
valores limitativos, 283 
visão geral, 281 
números de Bernoulli, 286-295 
exercícios, 292-295 
fórmula de integração de Euler-Maclaurin, 288-289 
função zeta de Riemann, 290-291 
melhoria de convergência, 292 
polinômios, 288 
visão geral, 286-288 
produtos de, 300-304 
convergência de, 301 
exercícios, 303-304 
funções seno, co-seno e gama, 301-302 
visão geral, 300-301 
séries assintóticas, 295-300 
definição de, 298-299 
exercícios, 299-300 
função gama incompleta, 295-297 
integral de co-seno e seno, 297-298 
visão geral, 295 
séries de potências, 275-277, 437 
teorema de Riemann, 677-680 
séries oscilantes, 245 
séries semiconvergentes, 296 
séries, veja séries infinitas 
símbolo de Levi-Civita, 113 
símbolo de Pochhammer, 650-61, 654 
símbolos de Christoffel, 118-119 


simetria, 673 
cilíndrica, 467 
de soluções, 430 
de tensores, 106 
eixos de, tripla 
duas vezes, 223-225 
trê vezes, 225-228 
esférica, 466 
propriedadaes de matrizes ortogonais, 154-156 
relações, 366 
sabor SU(3), 194-197 
simetrização de nucleos, 781 
singularidade irregulares, 432 
singularidade(s), 332-335 
exercícios, 334-335 
fixas, 826 
móveis, 826 
pólos, 332 
pontos de ramo, 333-334 
de ordem 2, 333-334 
série de Laurent, 332 
visão geral, 331 
singularidades fixas e móveis, soluções especiais, 826 
singularidades regulares, 432 
sistemas dinâmicos, dissipação em, 836-837 
solenoidal, 33 
solução de série de Neumann, 774 
solução de transformada de Fourier, 769 
solução numérica, 776-778 
solução parabólica geral, 408 
soluções de forma fechada, 612-614 
soluções de série — método de Frobenius, 427-437 
expansão em, torno de xo, 430 


limitações da abordagem de série — equação de Bessel, 430-431 


simetria de soluções, 430 
singularidades regulares e irregulares, 432 
teorema de Fuchs, 433 
soluções de séries descendentes de potências, 279, 590 
soluções linearmente dependentes, 415 
soluções linearmente independentes, 415 
soluções sóliton, 409 
soma, produto e razão de variáveis aleatórias, 855-856 
somatório de série, 689 
sorvedouro estável, 830 
sorvedouro, 828-831, 836 
substituição mínima, 59 
substituição, 741-742 
subtração 
de conjuntos, 843 
de matrizes, 135-136 
de séries, 247-248 
de tensores, 105-106 
superfície de Riemann, 339-340 
superfície orientada, fluxo magnético através de, 233 


T 
tableaux de Young para SU(n), 208-210 
tableaux para SU(n), Young, 208-211 
tambor elíptico, 659-660 
técnica de iteração de Gauss-Seidel, 131 
técnica de Jacobi, 171 
técnica variacional de Rayleigh-Ritz, 814-817 
autofunção de estado fundamental, 814 
corda vibratória, 815 
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temperatura crítica, 823 
tensor contravariante, 105, 120-121, 123, 124 
tensor de curvatura de Riemann-Christoffel, 107 
tensor direto, 137 
tensor métrico, 116-118 
símbolos de Christoffel como derivadas de, 119 
tensor misto, 105, 108, 118 
tensor simétrico, 106 
tensores de segunda ordem, 105 
tensores duais, 113-114 
tensores esféricos, 205-208 
tensores gerais, 116-123, veja também símbolos de Christoffel 
derivada covariante, 120 
exercícios, 122-123 
geodésica e transporte paralelo, 120-123 
tensor métrico, 116-118 
visão geral, 116 
tensores irredutíveis, 114-116 
tensores não-cartesianos, 108 
tensores, veja também derivada operadores, tensor; produto direto; 
tensores gerais; pseudotensores; regra do quociente, espinores 
análise vetorial em, 103-125 
adição e subtração de, 105-106 
contração, 107-108 
convenção de soma, 105-106 
segunda ordem, 105 
simetria — anti-simetria, 106 
visão geral, 103-104 
esférico, 205-208 
relação com matrizes ortogonais, 156 
tensores gerais, 116-123, veja também símbolos de Christoffel 
derivada covariante, 120 
exercícios, 122-123 
geodésica e transporte paralelo, 120-123 
tensor métrico, 116-118 
visão geral, 116 
teorema binomial, 270-271 
teorema da adição para harmônicos esféricos, 603-607 
derivação do teorema da adição, 603-604 
identidade trigonométrica, 603 
polinômios de Legendre, 603 
teorema da conservação, 235 
teorema da convergência do produto, 261 
teorema da convolução (dobraduras), 720-723, 750-753 
oscilador forçado com atenuação, 751-753 
relação de Parseval, 721 
transformada de Fourier, 705-706, 708-716 
transformada de Laplace, 731-761 
teorema da dimensionalidade, 227 
teorema da unicidade, 276-277 
de séries de potências, 276-277 
expansão de Laurent, 327 
operador inverso, 137 
séries de potências descendentes, 591 
Teorema de Abel, 668 
teorema de expansão de Heaviside, 335, 761 
teorema de Floquet, 663 
teorema de Fuchs, 433 
teorema de Gauss, 46-49 
formas alternativas de, 48-49 
exercícios, 48-49 
visão geral, 48 
retornos, 237-238 


visão geral, 46-47 
teorema de Green, 47, 448 
teorema de Helmholtz, 74-78 
exercícios, 78 
visão geral, 74-75 
teorema de Lerch, 733 
teorema de Liouville, 428324 
teorema de Maclaurin, 269 
função exponencial, 269 
logaritimo, 269 
visão geral, 269 
teorema de Mittag-Leffler, 349 
teorema de Morera, 323-324 
teorema de Riemann, 261 
teorema de Riesz, 135 
teorema de Rouché, 351 
teorema de Stokes, 50-53 
em formas diferenciais, 239 
variedade de Riemann, 239 
exercícios, 52 
formas alternativas de, 51-53 
leis de Oersted e Faraday, 51-53 
visão geral, 51 
prova, 317-318 
retornos, 236 
visão geral, 50 
teorema de Titchmarsh, 368 
teorema de von Staudt-Clausen, 287 
teorema de Wigner-Eckart, 207 
teorema do deslocamento de Heaviside, 743 
teorema do produto, 137 
teorema do resíduo, 345-346, 357; veja também cálculo de resíduos 
teorema do valor médio, 268 
teorema dos números primos, assintótico, 679-680 
teorema fundamental da álgebra de Gauss, 324, 351 
teorema integral de Fourier, 709 
desenvolvimento de, 708-710 
forma exponencial, 709 
teoria de calibre, 59, 183 
teoria de difusão de nêutrons, 279, 720 
teoria de grupo, 183-244, veja também momento angular; formas 
diferenciais ; geradores de grupos contínuos; grupo 
homogêneo de Lorentz 
Vierergruppe, 222, 225 
caráter, 140 
covariância de Lorentz de equações de Maxwell, 215-221 
exercícios, 219-221 
invariante eletromagnéticas, 219 
transformação de E e B, 218-219 
visão geral, 215-217 
cromodinâmica quântica (QCD), 197 
definição de, 184 
discreta, 221-223 
classes e caráter, 222-223 
diédrico, Dn, 227 
eixo de simetria duplo, 223-225 
eixo de simetria triplo, 225-227 
exercícios, 227-231 
grupos e classes laterais, 223 
ponto e espaço cristalográfico, 227-228 
fidelidade, 184 
grupo unitário especial SU(2), 190 
grupos de permutação, 229-231 
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homomórfico, 184 
homomorfismo SU(2)-SO(3), 191-194 
homomorfismo e isomorfismo, 184-185 
isomórfico, 184 
representações redutíveis e irredutíveis, 185-186 
visão geral, 183-184 
teoria de Hilbert-Schmidt, 781-786 
autofunções ortogonais, 781-783 
equação integral não-nomogênea, 783-785 
simetrização de núcleos, 781 
teoria de Sturm-Liouville, 670 
teoria de Sturm-Liouville — funções ortogonais, 469-509 
completude de autofunções, 490-499 
coeficientes de expansão, 497 
desigualdade de Bessel, 491-492 
desigualdade de Schwarz, 492-494 
resumo — espaços vetoriais, completude, 494-497 
teoria de Sturm-Liouville — funções ortogonais 
completude de autofunção, 497-499 
EDOs auto-adjuntas, 469-478 
autofunções, autovalores, 471 
condições de contorno, 473-474 
dêuteron, 472-473 
equação de Legendre, 472 
exercícios, 476-478 
intervalo de integração [a, b], 474 
operadores hermitianos em mecânica quântica, 475 
operadores hermitianos, 475 
função de Green — expansão de autofunção, 499-509 
autofunção, equação de autorvalor, 503-504 
exercícios, 506-509 
função de Green e a função delta de Dirac, 505-506 
funções de Green — unidimensionais, 500-502 
integral da função de Green — equação diferencial, 502-503 
oscilador linear, 505 
operadores hermitianos, 479-484 
autofunções ortogonais, 480 
autovalores reais, 479 
degenerescência, 481 
exercícios, 482-484 
expansão em autofunções ortogonais — onda quadrada, 481 
série de Fourier — ortogonalidade, 480-481 
ortogonalização de Gram-Schmidt, 484-490 
exercícios, 488-490 
polinômios de Legendre por ortogonalização de Gram-Schmidt, 
487 
teoria do potencial 
força conservativa, 53 
potencial eletrostático, 447 
potencial escalar, 54 
potencial vetorial, 57, 237 
terema da unicidade, regra de L’Hôpital, 277 
termodinâmica, 56-61 
diferenciais exatas, 56-59 
potencial vetorial, 57-61 
exercícios, 59-61 
magnético, 58 
visão geral, 56-57 
teroia da difração de Kirchhoff, 322 
teste M de Weierstrass, 265-266 
teste da integral de Cauchy (Maclaurin), 249-251, 316-325 
derivadas, 322-323 
exercícios, 321, 324-325 


integrais de contorno, 316-317 
prova de Goursat, 318-320 
prova do teorema de Stokes, 317-318 
regiões multiplamente conectadas, 320-321 
teorema de Morera, 323-324 
visão geral, 316, 321-322 
teste da integral de Maclaurin, 249-251 
função zeta de Riemann, 251 
teste da integral, Cauchy, veja teste da integral de Cauchy 
(Maclaurin) 
teste da raiz, Cauchy, 249 
teste da razão de d’ Alembert, 249 
teste da razão, Cauchy, d’ Alembert, 249 
Teste de Abel, 266, 502 
teste de Gauss, 253, 271 
série de Legendre, 253-254 
teste de Kummer, 251-252 
teste de Raabe, 253 
testes de aptidão escolar, 844-845 
testes de comparação, 248 
E, transformação de Lorentz do campo elétrico, 218-219 
trabalho dependente da trajetória, 44-46 
definições integrais de gradiente, divergência e espiral, 44-45 
integrais de superfície, 44 
integrais de volume, 44 
visão geral, 43 
trabalho, potencial, 27, 54-56 
traço, 108 
traços de matrizes, 139-140 
trajetória, 30, 825-826, 827-828, 832, 834, 835, 837, 838 
tranformadas de Laplace, 731-736 
de derivadas, 736-741 
força impulsiva, 739 
função delta de Dirac, 738-739 
nutação da Terra, 737-738 
oscilador harmônico simples, 737 
definição, 731 
expansão por frações parciais, 733-734 
função escalonada, 734 
funções elementares, 731 
tabela de transformadas, 732-733, 742 
teorema da convolução, 393, 758, 761, 769 
transformada inversa, 732-733 
translação, 758 
transformação de E e B, Lorentz, 218-219 
transformação de equação diferencial em equação integral, 765 
transformação de paridade, 111 
transformação de similaridade, 156 
transformada de Fourier de derivadas, 716-720 
EDP de fluxo de calor, 718 
equação de onda, 717 
inversão de EDP, 718-719 
transformada de Fourier, da gaussiana, 705-706 
transformada de seno, 711 
transformada discreta de Fourier, 692-695 
aliasing, 693-694 
limitações, 693 
ortogonalidade sobre pontos discretos, 692 
transformada rápida de Fourier, 694 
transformada exponencial, 710 
transformada inversa de Laplace, 753-761 
integral de Bromwich, 753-754 
inversão via cálculo de resíduos, 755 
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resumo — inversão de transformada de Laplace, 758 
velocidade de ondas eletromagnéticas em um meio dispersivo, 
756-757 
transformada inversa, 732-733 
transformada rápida de Fourier, 694 
transformada, derivada de, 744-745; veja também co-senos; 
exponencial; Fourier; Fourier-Bessel; Hankel; Laplace; 
Mellin; seno 
transformadas de Fourier, 368, 705 
aliasing, 693 
derivação da função delta, 709 
funções de transferência, 728 
teorema da convolução, 720 
transformadas de Fourier — teorema da inversão, 710-716 
integral de Fourier, 705, 708-711 
princípio da incerteza, 712 
representação de momentum espacial, 723 
transformada de co-seno, 710-711 
transformada de seno, 711 
transformada exponencial, 710 
transformada rápida de Fourier, 694 
trem de ondas finito, 711-712 
transformadas de Hankel, 706 
transformadas de Hilbert, 366 
transformadas de Laplace, Mellin e Hankel, 706 
transformadas de Mellin, 679, 706 
transformadas integrais, 705-762 
translação, 336, 743 
transporte paralelo, 120-123 
transposição, 134 
trem de ondas finito, 711-712 
Tschebyscheff, veja Chebyshev 


U 


união de conjuntos, 843 


V 
valor esperado, 475, 723-724, 848 
valor extremo ou estacionário, 29, 667, 787-789 
valor médio, 848 
valor principal, 309 
valor principal de Cauchy, 346-349, 357 
valores assintóticos, funções de Bessel, 546, 551 
valores especiais, 586 
valores, limites, de integrais elípticas, 283-284 
variação da constante, 414 
variação com restrições, 808-813 
desprendendo-se de um tronco, 810-811 
equação de onda de Schrödinger, 811-812 
equações lagrangianas, 809 
pêndulo simples, 809-810 
variação, conceito de, 787-790 
variações, veja também cálculo de variações 
variância, 774 
variáveis aleatórias, 847-858 
medições de desvio-padrão, 850-852 
soma, produto e razão de variáveis aleatórias, 855-856 
variável aleatória contínua: átomo de hidrogênio, 848-849 
variável aleatória discreta, 847-848 
variáveis complexas, 305-344, 346-376, veja também cálculo de 
resíduos; condições de Cauchy-Riemann; funções; 
mapeamento; pontos de sela (método da inclinação mais 
acentuada); singularidades 
expansão de Laurent, 325-332 


continuação analítica, 327-328 
exercícios, 331-332 
expansão de Taylor, 325-326 
princípio da reflexão de Schwarz, 326-327 
fórmula integral de Cauchy, 321-325 
derivadas, 322-323 
exercícios, 324-325 
teorema de Morera, 323-324 
visão geral, 321-322 
relações de dispersão, 365-370 
causalidade, 368 
dispersão óptica, 367 
exercícios, 369-370 
relação de Parseval, 367-368 
relações de simetria, 366 
visão geral, 365-366 
Teorema integral de Cauchy, 316-321 
exercícios, 321 
integrais de contorno, 316-317 
prova de Cauchy-Goursat, 318-320 
prova do teorema de Stokes, 317-318 
regiões multiplamente conectadas, 320-321 
visão geral, 316 
utilizando álgebra, 306-312 
cálculo de resíduos, 345-365 
conjugação complexa, 308-309 
exercícios, 309-312 
permanência da forma algébrica, 306-308 
visão geral, 306 
visão geral, 305, 345 
variáveis dependentes e independentes, 787-792 
caminho óptico perto do horizonte de evento de um buraco negro, 
790-791 
conceito de variação, 787-790 
formas alternativas de equações de Euler, 791 
variáveis dependentes omitidas, 791 
variáveis dependentes faltantes, 791 
variáveis separáveis, 411 
variáveis, veja também variáveis complexas 
dependentes e independentes, 787-792, 803-804 
caminho óptico perto do horizonte de evento de um buraco 
negro, 790-791 
conceito de variação, 787-790 
formas alternativas de equações de Euler, 791 
variáveis dependentes faltantes, 791 
dependentes, 798-803 
equação de Laplace, 803 
partícula em movimento — coordenadas cilíndricas circulares, 
800 
partícula em movimento — coordenadas cartesianas, 800 
princípio de Hamilton, 799-800 
múltipla, de expansão de Taylor, 271 
separação de, 418-425 
variável aleatória contínua, 848-849 
variável aleatória discreta, 847-848 
variedade de Riemann manifold, 239 
velocidade de ondas eletromagnéticas em um meio dispersivo, 
756-757 
verificação da relação pi-seno, 394 
vetor axial, 111 
vetor contravariante, 104 
vetores covariantes, 104, 117 
tensor, 105, 120-122, 123, 124 
vetores de peso, 201 
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vetores polares, 111 
vetores unitários, 96 
cilíndricas circulares, 90 
coordenadas cartesianas, 4 
coordenadas polares esféricas, 98 
polar esférica, 153 
relação de ortogonalidade, 491 
vetores, 1-79, veja também coordenadas curvas e vetores; 
divergência, V; gradiente, V; integração; potenciais; 
rotações; teorema de Stokes; tensores 
abordagem elementar a, 1-6 
abordagem elementar de, exercícios, 5-6 
aplicações de matrizes ortogonais a, 149-150 
aplicações sucessivas de V, 38042 
equação de onda eletromagnética, 40-41 
exercícios, 41-42 
laplaciano de potencial, 39 
visão geral, 38-39 
componentes, 6, 9, 117-118, 494 
contravariante, 104-105, 108, 117-118, 121-122 
co-variantes, 104-105, 108, 117-118, 120, 121-122 
definições e abordagem elementar, 1-6 
exercícios, 5-6 
direção, 4 
espaço, 9 
exercícios, 9-10 
espiral, Vx, 34-38 
de campo de força central, 34-36 
exercícios, 36-38 
gradiente de produto escalar, 36 
integração por partes de, 36-37 
potencial de campo B constante, 34 
visão geral, 34 
função delta de Dirac, 64-74 
carga total dentro de uma esfera, 69 
espaço de fase, 69 
exercícios, 71-74 
representação por funções ortogonais, 69-70 
representações integrais para, 70-74 
visão geral, 64-68 
independência linear de, 131 
irrotacional, 35-36 


lei de Gauss, 61-64 
equação de Poisson, 61-64 
exercícios, 64 
lei triangular da adição, 1 
normal, 12, 43 


operadores vetoriais diferenciais, 85-88 


divergência, 86-87 

rotacional, 87 

exercícios, 88 

gradiente, 85 

visão geral, 85 
ortogonal, 84, 131-132 
ou produto externo, 14-17 

exercícios, 17-20 


por ortogonalização de Gram-Schmidt, 132-134 


potenciais, magnético, 99 
produto cruzado de, 240 
produto direto de, 138 
produto escalar triplo, 20-21 


produto escalar, ou interno, 10-14 


exercícios, 13-14 


invariância sob rotações, 12-13 


produto triplo de, 22-23 
exercícios, 22-25 
serve como uma base, 4 
teorema de Gauss, 46-49 
exercícios, 48-49 
formas alternativas de, 48 
teorema de Green, 47 
visão geral, 46-47 
teorema de Helmholtz, 74-78 
exercícios, 78 
visão geral, 74-75 
visão geral, 1 
vibração, modos normais de, 177 
Vierergruppe, 222, 225 


wronskiano, 415 


zeros, função de Bessel, 515 
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